Wie aus Daten Insights werden – Teil 2: Daten analysieren
Aus dem ersten Teil unserer Mini-Serie „Wie aus Daten Insights werden“, wissen wir bereits, dass täglich ca. 3 Milliarden Mobilfunksignalisierungsdaten, die zuvor ein TÜV-geprüftes Anonymisierungsverfahren durchlaufen, von uns verarbeitet werden.

Teil 2: Datenanalyse
Im zweiten Teil beleuchten wir die Aufbereitung der Daten und wie bei einem Marktanteil von unter 50%, sowie einer Ungenauigkeit von mehreren hunderten Metern, aussagekräftigen Analysen zustande kommen.
In einem ersten Vorverarbeitungsschritt werden die anonymisierten Daten aggregiert und auf offensichtliche Ausreißer, sogenannte „Outliers“ analysiert. Solche Ausreißer können zum Beispiel vorkommen, wenn sich mobile Endgeräte rotierend bei unterschiedlichen Makromobilfunkzellen anmeldet, weil sich die Sendebereiche der Zellen überlagern. In solchen Fällen kann es zu geografischen Sprüngen von mehreren Kilometern, innerhalb weniger Sekunden kommen.
Nachdem alle „Outliers“ bereinigt wurden, werden die Makrodaten (Zusammengefasste Signalpunkte) in bewegende und stationäre Segmente unterteilt und entsprechend den regionalen Hochrechnungsfaktoren extrapoliert.
Die Aggregation der anonymisierten Daten ist ein weiterer Mechanismus in Bezug auf den Datenschutz, da mindestens 20 anonymisierte Bewegungsströme zusammengefasst werden. Anhand eigens entwickelter Modelle und Analyseverfahren verfolgen wir einen probabilistischen Ansatz und erheben unter Berücksichtigung unterschiedlicher Einflussfaktoren, welche großflächigen Standorte in zeitlicher Abfolge besucht wurden. Im Zuge dieser Analysen können wir unseren Kund*innen zum Beispiel Quelle-Ziel Matrizen auf Gemeindeebenen, sowie eine Frequenzlandschaft, unter Verwendung des Statistik Austria-Rasters (500m x 500m)in interaktiven Dashboards, pdf Reports, oder csv Files zur Verfügung stellen.
Über die Bereitstellung, sowie die Darstellung dieser anonymisierten Analyseergebnisse berichten wir nächste Woche.