Sekundärnutzung von Daten

BFS startet Plattform für vertrauliche Datenanalysen

Uhr
von Yannick Chavanne und Joël Orizet und ahu

Das Bundesamt für Statistik bringt eine Plattform namens Lomas an den Start. Sie soll dazu dienen, das Potenzial von Daten der öffentlichen Verwaltungen zu nutzen, ohne das Recht auf Schutz der Privatsphäre zu verletzen.

(Source: Gorodenkoff / stock.adobe.com)
(Source: Gorodenkoff / stock.adobe.com)

Das Kompetenzzentrum für Datenwissenschaft (DSCC) des Bundesamts für Statistik (BFS) hat eine Open-Source-Plattform namens Lomas entwickelt. Sie soll neue Möglichkeiten für die Sekundärnutzung von Daten der öffentlichen Verwaltungen schaffen und Grundlagen für politische Entscheidungen liefern - zum Beispiel im Bereich der öffentlichen Gesundheit.

Autorisierte User, das heisst Forschende oder Analystinnen und Analysten des Bundes, könnten damit Daten unter Wahrung höchster Datenschutzstandards auswerten, teilt das BFS mit. Auf der Plattform liessen sich Datensätze mit Algorithmen auswerten, ohne direkt auf die Daten zuzugreifen. Die Ergebnisse der Berechnungen würden in einem geschützten Rahmen geliefert, ohne Daten an die User weiterzugeben, schreibt das BFS. 

Demnach kommt zu diesem Zweck ein Differential Privacy Framework zur Anwendung. Mit diesem Ansatz lassen sich Daten durch das Hinzufügen von kontrolliertem Rauschen so verändern, dass zwar statistische Rückschlüsse nach wie vor möglich sind, sich jedoch keine personenbezogenen Informationen mehr daraus ableiten lassen. 

Die Plattform ist aktuell noch im Proof-of-Concept-Stadium und auf der Github-Seite des DSCC verfügbar - weiterführende Informationen zur Implementierung sowie zum Differential-Privacy-Ansatz beschreibt ein Team aus Datenwissenschaftlern des BFS in einem Arxiv-Paper

 

Das BFS setzt übrigens auf maschinelles Lernen, um Daten effizienter und genauer auszuwerten - im vergangenen Jahr kam beispielsweise das Deep-Learning-Modell "Adele" erstmals zur Erstellung der Arealstatistik zum Einsatz. Lesen Sie hier mehr dazu

Webcode
5RADArHN