Web-Analyse mit KI und ChatGPT
von Olaf Brandt
Versehentliche Identifier vermeiden
Bei etracker Analytics wird die IP-Adresse automatisch im Arbeitsspeicher der Datenannahme-Server – also zum frühestmöglichen Zeitpunkt – anonymisiert. Zusätzlich gibt es jetzt einen Automatismus zur Anonymisierung von Identifikatoren in Seiten-URLs nach dem Privacy-by-Design-Prinzip.
Bitte beachte: Da derartige IDs sehr unterschiedliche Ausprägungen haben können, kann der Automatismus mit heuristischen Verfahren nicht die individuelle Überprüfung im Reporting ersetzen.
Beispiel für eine URL mit ID:
https://shop.demoshop.de/index.php/payment/customer_id/38027161-e6f9-304e-b25c-8a24ea780395/target/payment
Ergebnis im Reporting mit automatischer Anonymisierung:
https://shop.demoshop.de/index.php/payment/customer_id/.../target/payment
In URL-Parametern hingegen werden IDs nur erfasst, wenn die entsprechenden Parameter explizit in der Erfassung eingeschlossen werden. In diesem Fall gilt die automatische Anonymisierung analog.
Warum sind Identifier kritisch?
Werden Sitzungs- oder Nutzer-IDs erfasst, sind einerseits datenschutzrechtliche Aspekte zu beachten und andererseits sind die Auswertbarkeit der Daten und die Ladedauer der Reports aufgrund der unnötig erhöhten Kardinalität betroffen.
Neben den negativen Auswirkungen auf die Analysen können Identifier auch einen Personenbezug aufweisen. In diesem Fall kann ein Verstoß gegen Art. 5 DSGVO vorliegen, der die Datenminimierung als einen der Grundsätze der Verarbeitung personenbezogener Daten verlangt: Personenbezogene Daten müssen demnach „auf das für die Zwecke der Verarbeitung notwendige Maß beschränkt sein“.
Nach Urteil des Gerichts der Europäischen Union (EuG) vom 26.4.2023 (Az: T-557/20) müssen für einen möglichen Personenbezug bei IDs folgende Bedingungenvorliegen:
- Im Gegensatz zu anonymen Daten lässt sich die Person hinter der ID durch Heranziehung zusätzlicher, separat aufbewahrter Informationen re-identifizieren.
- Der oder die Datenempfänger verfügen über diese Informationen zur Re-Identifikation oder haben rechtliche Möglichkeiten, auf solche Informationen zuzugreifen.
Das heißt, dass sich Website-Betreiber bei Einsatz von Google Analytics u.a. auch darüber Gedanken machen müssen, welche Möglichkeiten der Re-Identifikation Google selbst hat, da Google nicht nur Auftragsverarbeiter, sondern auch Datenempfänger ist.
Was tun, wenn Identifier ausdrücklich gewünscht sind?
Hier sind zwei Fälle zu unterscheiden:
- Die eigentliche ID ist in der Auswertung irrelevant. Es geht nur darum, ob eine ID vorhanden ist, um bspw. Besuche mit und ohne Login zu unterscheiden.
Da die Anonymisierung den Parameter-Wert, aber nicht den Parameter als solchen ersetzt, kann einfach bspw. nach dem entsprechenden Parameter gefiltert werden, z.B.:
oid=… - Die jeweilige ID ist relevant wie für Remarketing-Zwecke oder anderes Matching. In diesem Fall kann eine eigene Segment-Dimension entweder auf Besuchs- oder Nutzerebene genutzt werden. Gehe hierfür zu Einstellungen → Account → Datenanreicherung → Eigene Dimensionen.
Der neue Automatismus verstärkt somit die Datenschutzfreundlichkeit von etracker Analytics und macht gleichzeitig die Auswertbarkeit einfacher und schneller.