FAQ: Wie aus Daten Insights werden

Wie aus Mobilfunkdaten, datenschutzkonforme Insights werden erklären wir Euch im nachfolgenden Post.

Was macht Invenium eigentlich?
Wir, ein 20-köpfiges Team aus Mathematiker*innen, Datenanalyst*innen und Softwareentwickler*innen erforschen die menschliche Mobilität. Wir wollen verstehen wie sich Menschen bewegen und damit die Welt, in der sie sich bewegen verbessern. Unsere Daten helfen, den öffentlichen Verkehr zielgenauer anbieten zu können, den Verkehrsfluss zu optimieren oder Touristenströme so zu verteilen, dass sich das Erlebnis von Touristen und Einheimischen verbessert. Dies alles geschieht durch Auswertung von großen Mengen an Mobilfunksignalisierungsdaten, welche uns unser Partner, die A1 Telekom, anonymisiert zur Verfügung stellt.

Was sind Mobilfunksignalisierungsdaten?
Abgesehen von einem exzellenten Wort für die nächste Runde „Hangman“ sind Mobilfunksignalisierungsdaten technische Daten die bei einem Mobilfunk Anbieter (in Österreich sind das die A1, Magenta und Drei) zur Aufrechterhaltung deren Infrastruktur anfallen. Jeder Anbieter nutzt Monitoring Systeme, um zu wissen, wie viele Mobiltelefone zu einem bestimmten Zeitpunkt mit einem Mobilfunkmasten verbunden sind. Diese Daten, die zwischen Mobiltelefon und Mobilfunkmast ausgetauscht werden, garantieren eine optimale Netzabdeckung und beugen eine Überlastung von einzelnen Masten vor. Mobilfunksignalisierungsdaten nützen aber nicht nur den Nutzer*innen ein qualitativ hochwertiges Gespräch zu führen, oder schnell im Netz zu surfen, sondern auch uns, um die menschliche Mobilität zu analysieren und zu verstehen. Bei diesen Daten handelt es sich ausschließlich um technische Daten, nicht um Kundendaten. Die SIM-Karten Identifikationsnummer (IMSI), wird von unserem Provider A1, in einem TÜV-geprüften Anonymisierungsverfahren, durch eine zufällig generierte ID ersetzt, bevor die Daten mit uns geteilt werden. Somit ist es für uns zu keinem Zeitpunkt möglich einen Personenbezug herzustellen.

Welche Informationen habt Ihr von den Nutzer*innen?
Wie bereits erwähnt werden die Daten, bevor wir sie bekommen, anonymisiert. Somit können wir weder einen Personenbezug herstellen noch ein Telefonie- oder Surfverhalten nachvollziehen. Jedes Mobiltelefon ist für uns eine Nummer, die zufällig generiert wurde.

Wie kommt ihr von den Mobilfunksignalisierungsdaten auf die Position eines Telefons?
Jeder von uns hat als Kind gelernt herauszufinden wie weit ein Gewitter noch entfernt ist – sobald es geblitzt hat, wurden die Sekunden bis zum Donner gezählt, mit 300 multipliziert und schon hatte man ungefähr die Entfernung gemessen. So ähnlich machen das auch Mobilfunkmasten. Die ungefähre Entfernung eines Geräts ergibt sich aus der Zeit, die eine Signalisierungsnachricht eines Mobiltelefons braucht, um bei einem Masten anzukommen. Kombiniert man die Information von mehreren Masten, ergibt sich die ungefähre Position des Telefons.

Wie präzise sind solche Informationen?
Etwas präziser als die Gewitter-Berechnungen, aber immer noch nicht perfekt. Die berechneten Positionen kann sehr stark variieren und hängt von den topografischen Gegebenheiten ab. Die Ungenauigkeit der Daten liegt zwischen ein paar hundert Metern in dicht besiedelten, städtischen Gebieten und einigen Kilometern in ländlichen Gebieten.
Wie funktionieren Apps, die meine Position auf „Meter“ genau kennen? Diese Apps als Navigationssystem wie z.B. Google Maps, oder als Aktivitätstracker wie z.B. Runtastic verwenden das im Telefon verbaute GPS-Modul. GPS (Global Positioning System) ist deutlich genauer und kann einen Standort auf einige Meter genau eingrenzen. Mobilfunkdaten, wie bereits erwähnt nur auf einige hundert Meter genau. Um es an einem Beispiel festzumachen – Google Maps erkennt bei welchem Hot-Dog Stand am Grazer Hauptplatz man zu Mittag gegessen hat, anhand der Mobilfunkdaten erkennen wir lediglich, dass sich ein Gerät im innerstädtischen Bezirk über einen bestimmten Zeitraum aufgehalten hat.

Ihr behauptet zwar keine persönlichen Daten zu verwenden, aber ist es nicht möglich mich allein durch meine Standortdaten zu identifizieren, vor allem wenn ich die einzige Person in diesem Bereich bin?
Nein, das ist absolut unmöglich. Unsere Ausgangsdaten sind zu ungenau, um den exakten Standort eines Gerätes zu ermitteln. Außerdem wird die zufällig generierte ID von unserem Provider alle 24 Stunden gelöscht und durch eine neue, wieder zufällig generierte ID ersetzt. Je nach Projektanforderung werden im Zuge der Analyseverfahren Personen gruppiert ausgegeben. Dies bedeutet im Detail, dass zum Beispiel in der Legende, die kleinste Einheit „kleiner als 20 Personen ist“. Somit kann dies eine Person in dem definierten Bereich sein, oder auch 19.

Wenn ihr keine genauen Standorte kennt, sind euren Analysen dann nicht wertlos?
Ganz im Gegenteil. Unsere Intention ist ja nicht die Einzelpersonenverfolgung, sondern die Analyse des Mobilitätsverhalten von Menschengruppen. Die Bewegungsmuster und Bewegungsströme – quasi der Fluss und nicht der einzelne Wassertropfen. Dadurch lassen sich interessante Erkenntnisse gewinnen:

  • Interaktion zwischen Gemeinden, Städten, Bezirken
  • Wo finden signifikante Bewegungen statt
  • Woher kommen die Menschen, wie lange bleiben sie in einem Bereich und wohin gehen sie danach.

Um diese Fragen anhand unserer Analyseverfahren beantworten zu können, stellen Mobilfunksignalisierungsdaten eine optimale Datengrundlage dar.

Reichen die Daten der A1 aus? Bräuchte man nicht die Daten aller Mobilfunkbetreiber und somit aller Geräte, um aussagekräftige Analysen erstellen zu können?
Die A1 Telekom mit Bob, Yesss! Und Red Bull Mobile, verfügt über einen gesamtösterreichischen Marktanteil von circa 43%. Dadurch ergibt sich ein repräsentativer Querschnitt der Bevölkerung in jeder Gemeinde. Da davon ausgegangen werden kann, dass sich das Bewegungsverhalten von Personen unterschiedlicher Mobilfunkanbieter nicht signifikant unterscheidet, kann eine Hochrechnung der vorliegenden Daten, ausgehend von den regionalen Marktanteilen, auf die restliche Bevölkerung erfolgen.

Arbeitet ihr DSGVO konform?
Ja, natürlich. Außerdem haben wir zwei Jahre damit verbracht, unser Produkt und die eingesetzten Algorithmen von allen relevanten Institutionen testen zu lassen. Sowohl die österreichische Datenschutzbehörde als auch der TÜV Saarland haben unser Anonymisierungsverfahren als datenschutzkonform bestätigt. Das gleiche gilt für eine Studie der führenden Rechtsexperten der Universität Wien (ISBN 978-3-903035-12-6).

Auch wenn das alles stimmt, wie kann gewährleistet werden, dass eure Kunden die Daten nicht missbrauchen?
All unsere Kunden, inklusive der österreichischen Regierung die unsere Daten im Kampf gegen COVID-19 einsetzt, erhalten von uns ausschließlich Analyseergebnisse – niemals aber die Rohdaten. Je nach Fragestellung finden sich zum Beispiel signifikanten Bewegungsströmen auf Gemeindeebene in einer interaktiven Web-Applikation als textueller Bericht oder als Grafik wieder. Die Auswertung erfolgt, wie bereits erwähnt, gruppenweise – zwischen 20 und 40 Geräte haben sich zwischen den beiden ausgewählten Gemeinden in dem definierten Zeitfenster bewegt.

Das könnte Sie noch interessieren

Wie aus Daten Insights werden – Teil 4: Fragen beantworten

11.10.22 #Allgemein

Im letzten Teil unserer Mini-Serie "Wie aus Daten Insights werden", widmen wir uns den Fragestellungen und Use-Cases unserer Kund*innen.

Zum Beitrag

Wie aus Daten Insights werden – Teil 3: Daten ausliefern

11.10.22 #Allgemein

In den ersten beiden Teilen unserer Mini-Serie "Wie aus Daten Insights werden", haben wir uns der Verarbeitung von ca. 3 Milliarden Mobilfunkdigitalisierungsdaten täglich in Kombination mit dem TÜV-geprüften Anonymisierungsverfahren, sowie der Datenaufbereitung zur Erstellung aussagekräftiger Analysen, gewidmet.

Zum Beitrag

Wie aus Daten Insights werden – Teil 1: Daten erfassen

11.10.22 #Allgemein

In unserer neuen Mini-Serie „Wie aus Daten Insights werden“ möchten wir Einblicke in unsere tägliche Arbeit geben und den Weg von der Erfassung der Daten bis hin zu gewinnbringenden „Insights“, welche Antworten auf die Fragen unserer Kund*innen geben, beschreiben.

Zum Beitrag