Man findet sie in den verschiedenen Varianten, beispielsweise als Diagramme, in allen Farben und Formen als einfache Excel-Datei oder in grafischen Dashboards: Statistische Auswertungen. Sie spielen auch für Arbeitgeber eine wesentliche Rolle, da sie regelmäßig dazu dienen, Erkenntnisse zu Vorgängen und Prozessen zu gewinnen und daraus Maßnahmen zur Optimierung abzuleiten. Hierzu werden Datensätze (in der Regel von einer größeren Anzahl von Personen) kombiniert, analysiert und zu einem Ergebnis verdichtet.

Wo Datensätze von Personen ausgewertet werden, ist auch die DSGVO nicht weit entfernt. Statistische Auswertungen sind daher Alltag in unserer Beratungspraxis. Ein berechtigtes Interesse an der Erstellung solcher Auswertungen wird man fast immer begründen können, sei es zu Zwecken der Personalbedarfsplanung oder zur Überprüfung von Personalkosten.

Anonymisierung als Schlüssel zur datenschutzkonformen Auswertung

Eines haben statistische Auswertungen, denen personenbezogene Daten zugrunde liegen, aber gemeinsam: Es sind stets alle Möglichkeiten auszuloten, die Auswertungen mit möglichst geringer Eingriffsintensität zu erstellen. In Betracht kommt hierbei insbesondere die Anonymisierung von Datensätzen.

Hierbei sind zwei Varianten denkbar:

  • Die Datensätze werden bereits vor der Analyse anonymisiert, so dass nur noch anonyme Daten ausgewertet werden.
  • Es werden personenbezogene Daten analysiert, aber das Ergebnis der Auswertung ist anonym.

Im ersten Fall werden schon keine personenbezogenen Daten verarbeitet, so dass dies stets die datenschutzfreundlichste Variante darstellt. Wenn auf einen Personenbezug im ersten Schritt aber nicht verzichtet werden kann, sollte der zweite Fall das Minimum darstellen.

Um es kurz zusammenfassen: Eine statistische Auswertung sollte möglichst immer aus aggregierten Daten bestehen und keine Rückschlüsse auf einzelne Personen zulassen. Alles andere wäre allenfalls in begründeten Einzelfällen denkbar.

Ab wann ist ein Datum eigentlich anonym?

Bei anonymen Daten handelt es sich um Informationen, „die sich nicht auf eine identifizierte oder identifizierbare natürliche Person beziehen, oder personenbezogene Daten, die in einer Weise anonymisiert worden sind, dass die betroffene Person nicht oder nicht mehr identifiziert werden kann“ (DSGVO Erwägungsgrund 26).

So einfach es klingt, so viele Schwierigkeiten bringt es in der Praxis mit sich. Nicht selten hören wir, dass die Statistik anonym sei, da sie keine Namen enthalten. Dies genügt allerdings in den meisten Fällen nicht, da anhand der anderen ausgewerteten Daten oft noch eine Identifizierung möglich ist. Je mehr Detailinformationen eine Auswertung beinhaltet und/oder je kleiner die dahinterstehende Gruppe ist, desto höher ist die Wahrscheinlichkeit, dass bestimmte Informationen einer bestimmten Person wiederum zuordenbar sind.

Ein Beispiel zur Verdeutlichung: Es soll eine Auswertung zur Fluktuationsquote und zu Fluktuationsgründen erstellt werden. Hierzu werden alle Kündigungen in einem bestimmten Zeitraum, die Kündigungsgründe sowie die Länge der Betriebszugehörigkeit erfasst. Sollte in einem Unternehmen innerhalb des ausgewerteten Zeitraums z. B. nur ein Mitarbeiter weniger als 6 Monate beschäftigt gewesen sein, so kann in der Auswertung auch ohne Nennung des Namens festgestellt werden, um welchen Mitarbeiter es sich handelt. Die Statistik ist folglich im Hinblick auf diesen Mitarbeiter nicht anonym.

Möchte man – um bei unserem Beispiel zu bleiben – die Statistik nun anonymisieren, muss man die Daten auf einer höheren Ebene aggregieren oder auf Zusatzinformationen wie die Betriebszugehörigkeit verzichten. Hierzu könnte man z. B. den Auswertungszeitraum deutlich vergrößern, so dass in der Statistik mehr Mitarbeiter auftauchen, die weniger als 6 Monate beschäftigt waren.

Ab welcher Aggregationsgröße von einer Anonymität ausgegangen werden kann, ist übrigens nicht eindeutig festgelegt. Die Datenschutzaufsichtsbehörde Baden-Württemberg schreibt in ihrem Ratgeber Beschäftigtendatenschutz (Stand: April 2020, 4. Auflage) im Zusammenhang mit der Anonymität bei Mitarbeiterbefragungen: „Auch wenn es keine festgeschriebene Antwort darauf gibt, ab welcher Aggregationsgröße – also dem Zusammenfassen von personenbezogenen Daten – kein Personenbezug mehr hergestellt werden kann, erscheint uns eine Mindestgröße von drei oder fünf Personen deutlich zu klein. Wir empfehlen eine Auswertung erst ab sieben Antworten vorzunehmen. In der medizinischen Forschung gehen wir inzwischen von Mindestgruppengrößen von 12 oder mehr aus.“

Besondere Vorsicht gilt bei Auswertungen mit sensiblen Daten

Bei Statistiken mit sensiblen Daten, insbesondere Gesundheitsdaten, ist die Anonymität von Auswertungen besonders relevant. Es ist bereits strittig, ob solche Auswertungen aus datenschutzrechtlicher Sicht überhaupt erstellt werden dürfen, wenn es hierfür kein öffentliches Interesse gibt (dies wird bei Statistiken durch den Arbeitgeber selten der Fall sein). Darüber hinaus ist eine Anonymisierung der Daten in diesen Fällen quasi Pflicht. Im Hinblick auf die besonderen Risiken, die mit der Verarbeitung von Gesundheitsdaten und Co. einhergehen, ist diese Einschränkung auch enorm wichtig.

Einwilligung als Alternative?

Als Alternative verbleibt im Übrigen nur noch eine Einwilligung der betroffenen Person in die Erstellung der Auswertung. Hierbei ist aber Vorsicht geboten: Einwilligungen unterliegen strengen Voraussetzungen. Insbesondere im Beschäftigungsverhältnis wird man nur in wenigen Fällen von einer freiwilligen Einwilligung ausgehen können. Arbeitgeber sollten sich daher bei der Erstellung statistischer Auswertungen nicht auf Einwilligungen ihrer Mitarbeiter stützen, sondern sich um datenschutzkonforme – anonyme – Auswertungen bemühen.