••• Insbesondere im Zusammenhang mit »Replay« werde ich in letzter Zeit häufiger gefragt, was genau ich denn da eigentlich beruflich die letzten Jahre gemacht habe. Für Laien ist das gar nicht so leicht zu erklären. Ich bin System Architekt für Softwaresysteme im Umfeld von Data Warehouses. Das sind zumeist sehr große Datenbanksysteme, in denen Informationen aus den operativen Systemen, über die Firmen ihre Geschäfte abwickeln, in einer Form zusammengeführt werden, die sich für Analysen des Geschäfts, der Kunden und der Kundenbeziehungen eignen. Diese Art Analysen nennt man Data Mining. »Unschuldig« anmutende Datenmengen geben, aufbereitet und in Beziehung gesetzt, mehr Informationen preis, als man gemeinhin so annimmt.
Dieses Geschäft ist unterdessen in so viele Spezialfelder zersplittert, dass man als Architekt kaum noch rundum voll im Stoff stehen kann. Meine Spezialität ist das Metadatenmanagement, die Planung, Entwicklung und Einführung von Tools, die Informationen über die im Data Warehouse gespeicherten Daten sammeln, aufbereiten und präsentieren. Dazu gehören Dokumentationen über Datenquellen, Datenflüsse, Abhängigkeiten, Qualitätskriterien, Fachzusammenhänge und und und. Es handelt sich um einen Spezialfall des Qualitätsmanagements im Data Warehouse.
Jens-Christian hat mir vor einigen Tagen einen Link zu einem sehr interessanten Blog-Beitrag geschickt, der anschaulich macht, worum es dabei geht. Geschrieben ist dieser Beitrag von Stephen Wolfram, Erfinder des Mathematik-Programms Mathematica und Mitgründer des sehr innovativen Suchmaschinenunternehmens Wolfram Alpha. Unter dem Titel »The Personal Analytics of My Life« berichtet Stephen Wolfram über die Daten, die er selbst in den letzten 20 Jahren über sich gesammelt hat, ganz einfach dadurch, dass er täglich einen Computer benutzt. Als Beispiel führt er die Datenbank seines Mail-Programmes an und zeigt an Charts, was sich alles aus den Absendezeitstempeln seiner Mails über ihn und seine Lebensgewohnheiten ablesen lässt.
Wenn man diesen Artikel gelesen hat und ein wenig weiter denkt, wird man womöglich noch einmal einen ganz anderen Blick auf das eigene Online-Verhalten bekommen. Die Analysen, die Stephen mit »seinen« Daten anstellt, können nämlich diverse Firmen auch mit »Ihren« Daten durchführen. Ein Beispiel gefällig? Wer den Facebook-Friendfinder benutzt, überlässt Facebook die Zugangsdaten zum eigenen E-Mail-Account. Ein Programm greift auf die unter diesem Account gespeicherten Nachrichten zu und wertet sie aus. Dabei geht es vor allem um das Auslesen der Adressaten und Absender der Mails. Dass sich Menge und Zeitstempel dabei ebenso auslesen lassen, wird nicht verwundern. De facto gibt man Facebook Vollzugriff auf jedes Detail in den Mail-Daten, und wenn man im Anschluss nicht das Passwort ändert, könnten die Facebook-Agentenprogramme diese Analysen im Prinzip beliebig oft wiederholen. Sie könnten. Ich sage nicht, dass sie es tun.
Wenn man einen GMail-Account verwendet, muss man sich vor dem Facebook-Friendfinder nicht fürchten. Denn man hat ja bereits einem anderen, der nicht »evil« sein will, nämlich Google, permanenten Vollzugriff auf die eigene Mail-Basis eingeräumt. Sie lagert praktischerweise sogar auf den Systemen des potentiellen Auswerters. Da kann man Facebook grad auch noch die Informationen hinterherwerfen.
Noch ein Beispiel dafür, was sich aus E-Mail-Daten an Information gewinnen lässt: Unschwer ist aus einem Mail-Archiv zu erkennen, in welchen sozialen Zusammenhängen sich der Inhaber des Accounts bewegt und ob er in diesen sozialen Netzwerken eher zu den Meinungsmachern oder Beeinflussbaren gehört. Zu welchen Firmen, etwa der Konkurrenz, Beziehungen bestehen und wie intensiv diese sind. Und das alles, wohlgemerkt, geben allein die Header der Nachrichten her. Man muss sich dafür noch nicht einmal mit dem Inhalt der Nachrichten befassen.
Wie weit die Möglichkeiten des Profilings heute bereits gehen, illustriert ein aktueller Fall aus der Schweiz den USA. Dort bietet eine Supermarktkette eine Bonuskarte an. Die Einkäufe werden gespeichert und analysiert, um den Kunden gezielt mit passenden Werbeangeboten beglücken zu können. Eines Tages kommt es zu einer Beschwerde. Warum, fragte ein Herr, er denn bitte Werbung für Babyartikel zugeschickt bekomme? Da sei ein Fehler im System, räumt die Firma ein und bittet um pardon. Einige Tage später ruft der Herr jedoch erneut an und entschuldigt sich seinerseits. Tatsächlich, teilt er mit, habe er soeben erfahren, dass seine minderjährige Tochter schwanger sei. Das ist eine erheiternde Geschichte. Entschuldigt hätte ich mich allerdings nicht, sondern mich von der Bonuskarte getrennt. Es wird berichtet, dass dieses Unternehmen sich nun Mühe gebe, die eigenen Analysen absichtlich zu verwässern, um beim Kunden keinen Argwohn durch zu passgenaue Angebote zu wecken.
Für viele Unternehmen ist heute ein Data Warehouse unerlässlich, um das eigene Geschäft durchschauen und vernünftig steuern zu können. In Deutschland regeln diverse strikte Gesetze, was mit personenbezogenen Daten angestellt werden und wie lange ein Unternehmen sie aufbewahren darf, während die Kundenbeziehung besteht und nachdem sie beendet wurde. Es existieren jedoch auch Gesetze, die Unternehmen wie etwa Telekommunikationsfirmen dazu verpflichten, bestimmte Daten über jeden einzelnen Kunden gezielt zu sammeln und aufzubewahren – für den Fall, dass sich der Staat dafür interessieren sollte.
Deutsche Datenschutzgesetze greifen indes ohnehin nicht, wenn man mit Unternehmen im Ausland eine Geschäftsbeziehung eingeht, indem man bspw. ein Profil auf einem sozialen Netzwerkdienst wie Facebook anlegt. Aber das ist ja auch wurscht. Schließlich haben Sie nichts zu verbergen. Sie sind ja kein Terrorist.
Am 10. März 2012 um 23:34 Uhr
Zum Thema Datensammeln gab es mal auf Golem einen Kommentar von Sven Türpe zur Sammel- und Statistikleidenschaft von Google.
Am 11. März 2012 um 07:45 Uhr
Eine kleine Korrektur: Es war kein Schweizer Unternehmen dass die Schwangerschaft der minderjährigen Tochter „erkannte“ sondern die amerikanische Kette „Target“: Quelle: Forbes.com
Am 11. März 2012 um 08:41 Uhr
Danke für den Hinweis auf Forbes. Dass man sich aber auch nie auf seine Quellen verlassen kann!
Am 11. März 2012 um 17:00 Uhr
Zu weiteren Lektüre:
• »Wie US-Behörden bei Facebook und Twitter schnüffeln«
• »Geheimdienst scannt ihre Kommentare«
Am 12. März 2012 um 21:01 Uhr
Gefunden! Hier ist der Forbes-Artikel, in dem über den obigen Fall berichtet wird: »How Target Figured Out A Teen Girl Was Pregnant Before Her Father Did«