Wie aus Daten Insights werden – Teil 1: Daten erfassen
In unserer neuen Mini-Serie „Wie aus Daten Insights werden“ möchten wir Einblicke in unsere tägliche Arbeit geben und den Weg von der Erfassung der Daten bis hin zu gewinnbringenden „Insights“, welche Antworten auf die Fragen unserer Kund*innen geben, beschreiben.
Teil 1: Datengewinnung
Um eine optimale Netzabdeckung zu garantieren und Überlastung einzelner Mobilfunkmasten vorzubeugen verwendet jeder Mobilfunk Anbieter (in Österreich sind das die A1, Magenta und Drei) Monitoring Systeme, um zu wissen, wieviel Mobiltelefone zu einem bestimmten Zeitpunkt mit einem Mobilfunkmasten verbunden sind. Zu diesem Zweck tauschen Mobiltelefone und Mobilfunkmasten technische Daten aus: sogenannte Mobilfunksignalisierungsdaten.
Diese Daten fallen an, wenn sich das Mobiltelefon mit einem Masten verbindet oder über einen Masten kommuniziert. Wenn das Mobiltelefon selten und nur zum Telefonieren genutzt wird, werden ca. 600 – 800 Mobilfunksignalisierungsdaten pro Tag generiert. Bei häufiger Nutzung des Geräts fallen ca. 8.000 – 10.000 solcher Datenpunkte pro Tag an. Diese rein technischen Daten nutzen wir, um Bewegungsströme zu analysieren. Ist ein Mobiltelefon über einen längeren Zeitraum mit den gleichen Masten bzw. unterschiedlichen Masten im gleichen Gebiet verbunden, lässt das auf einen stationären Aufenthalt in diesem Gebiet schließen. Ändert sich der Masten mit dem ein Gerät verbunden ist, können wir von der Abfolge der Masten auf eine Bewegung schließen. Die ungefähre Entfernung eines Gerätes zu einem Masten ergibt sich aus der Zeit, die eine Signalisierungsnachricht eines Mobiltelefons braucht, um bei einem Masten anzukommen. Kombiniert man die zeitlichen Informationen mehrerer Masten inkl. der Signalstärke, ergibt sich die ungefähre Position des Telefons. Die berechneten Positionen kann sehr stark variieren und hängt von den topografischen Gegebenheiten ab. Die Ungenauigkeit der Daten liegt zwischen hundert Meter in dicht besiedelten, städtischen Gebieten und einigen hunderten Metern in ländlichen Gebieten.
Als Partner der A1 Telekom Austria, bekommen wir täglich ca. 3 Milliarden Mobilfunksignalisierungsdaten von ungefähr 3.2 Millionen Geräten, um solche Trajektorien zu bauen Mit einem Marktanteil von ca. 42% ist dies schon eine repräsentative Stichprobe. Die SIM-Karten Identifikationsnummer (IMSI), wird von unserem Provider A1, in einem TÜV-geprüften Anonymisierungsverfahren, durch eine zufällig generierte ID ersetzt, bevor die Daten mit uns geteilt werden. Somit ist es für uns zu keinem Zeitpunkt möglich einen Personenbezug herzustellen. Außerdem wird die zufällig generierte ID von unserem Provider alle 24 Stunden gelöscht und durch eine neue, wieder zufällig generierte ID ersetzt.
Wie wir bei einem Marktanteil unter 50% und bei einer Ungenauigkeit von mehreren hunderten Metern trotzdem zu aussagekräftigen Analysen kommen, erklären wir im nächsten Teil der Mini-Serie „Wie aus Daten Insights werden“, wenn wir uns den statistischen Verfahren und Analysen widmen.