ETH Zürich stärkt Forschung in den Datenwissenschaften
Intelligente datenwissenschaftliche Ansätze verändern Wissenschaft, Wirtschaft und Gesellschaft. In einer neuen, interdisziplinären Initiative widmen sich ETH-Forschende aus Mathematik, Informatik und Informationstechnologie deshalb verstärkt den Grundlagen der Datenwissenschaften.
Wer heute mit dem Smartphone fotografiert, erhält automatisch ganze Fotoalben mit Titel, Datum, Reisekarte und Standortbezeichnungen digital zusammengestellt. Ohne eigenes Zutun. Die Resultate sind erstaunlich gut, jedenfalls so, dass ein Betrachter nicht einfach beurteilen kann, wer das Album erstellt hat: ein Mensch oder eine Maschine?
Das ist nur ein Beispiel, wie Computer im Alltag bestimmte Aufgaben lösen können, die früher dem Menschen vorbehalten schienen, weil sie Intelligenz und Lernfähigkeit voraussetzen. Für die Technologien und Methoden, die das möglich machen, haben sich klingende Namen wie "künstliche Intelligenz" oder "maschinelles Lernen" durchgesetzt.
Gemeint sind damit in der Regel lernfähige Berechnungsverfahren, sogenannte intelligente Algorithmen, mit denen sich kluges Lösen von Aufgaben automatisieren lässt. Beim maschinellen Lernen etwa lernt ein Computer anhand von Beispieldaten, wie er selbständig Muster und Regelmässigkeiten in Datensätzen erkennen kann.
Wie Daten zu Erkenntnis werden
Effiziente, intelligente Algorithmen, die selber lernen, wie sie in den Daten das erwünschte Wissen finden, wirken sich nicht nur auf private Nutzer und industrielle Abläufe aus, sie verändern auch die Art, wie sich Forschende und Computer ihre Arbeit teilen. Besonders bei sehr grossen, komplexen und uneinheitlichen Datenmengen können solche Algorithmen wertvolle Erkenntnisse ermöglichen, die sonst unbemerkt blieben.
Sowohl Beobachter als auch Gestalter dieser rasanten Entwicklung der datengetriebenen Methoden ist Peter Bühlmann. Von Haus aus ist der ETH-Professor ein Statistiker. Seit Jahresbeginn leitet er die neue Initiative der ETH Zürich für die "Grundlagen der Datenwissenschaften" ("ETH Foundations of Data Science"). Wie man aus Daten Informationen und Erkenntnisse gewinnen kann, ist seit jeher das Kerngeschäft der Statistik.
Die datengetriebenen Ansätze unterscheiden sich jedoch von den klassischen, sagt Bühlmann mit der Prise Witz, die ihn auszeichnet: "Im klassischen Ansatz der Statistik ging ein Forscher von einer wissenschaftlichen Fragestellung aus und überlegte sich sehr sorgfältig, welche Daten er mit welcher Methode erhob, um daraus möglichst informative Schlüsse zu ziehen. Weil die Daten heute, zugespitzt gesagt, wie automatisch vom Himmel fallen, ist das oftmals nicht mehr so."
Eine neue Dimension
Die neuen Ansätze, die intelligente Algorithmen verwenden, können auch ohne geplante Datenerhebung automatisch interessante Information aus vorhandenen Datenmengen herausziehen. Aus diesen neuen Möglichkeiten sind in den vergangenen Jahren die Datenwissenschaften entstanden: Heute sind sie ein interdisziplinäres Forschungs- und Entwicklungsgebiet im Schnittbereich von Statistik, Informatik, Informationstechnologie und Mathematik.
"Datenwissenschaften sind etwas Neues. Sie sind nicht einfach Statistik, nicht einfach Informatik und auch nicht einfach Informationstechnologie, sondern ein Zusammenwirken von allen drei", sagt Bühlmann. Mit der neuen Initiative stärke die ETH Zürich die datenwissenschaftliche Grundlagenforschung, indem sie die bestehende Expertise bündle. Beteiligt sind elf Professuren aus drei ETH-Departementen, die in den Bereichen Statistik, Maschinelles Lernen und Informationstechnologie forschen.
Der Fokus liegt auf Grundlagenfragen der mathematischen Theorien und der algorithmischen Methoden. Dazu gibt es je ein Programm für Postdoktorierende und für wissenschaftliche Gäste. Die Initiative ergänzt die Aktivitäten in der Ausbildung (Master in Data Science, DAS in Data Science) und im Wissens- und Technologietransfer zwischen den Disziplinen und zur Industrie (Swiss Data Science Center). Gestartet ist sie am 1. Januar 2019. Unterstützt wird sie mit 2,7 Mio. Franken von "ETH+", der ETH-weiten Initiative zur Förderung von interdisziplinären Projekten.
Verantwortung und faire Algorithmen
Da sich datenwissenschaftliche Neuerungen auf viele Nutzer in Wissenschaft, Wirtschaft und Gesellschaft auswirkten, trage die Grundlagenforschung eine besondere Verantwortung, so Bühlmann. Eine Herausforderung sieht er darin, Algorithmen zu entwickeln, die auch bei anspruchsvollen Datensätzen kausal korrekte, stabile, zuverlässige und gut interpretierbare Ergebnisse liefern. Bühlmann erhielt für seine Forschung über Stabilität und Kausalität (Ursache-Wirkung) 2018 die angesehene "Guy Medal in Silver" der Royal Statistical Society und einen "ERC Advanced Grant".
Nicht in jedem Fall gelingt die Automatisierung schliesslich so elegant wie in der erwähnten Foto-App. Mitunter kann die Anwendung intelligenter Algorithmen durchaus problematisch werden: Wenn zum Beispiel Computer aufgrund von Merkmalsdaten (Alter, Geschlecht, Nationalität, Gesundheit etc.) auslesen, wer kreditwürdig ist, oder wenn sie Richtern Hinweise geben, mit welcher Wahrscheinlichkeit Angeklagte schuldig sein könnten – dann sollten sich daraus keine Benachteiligungen ergeben.
Für Bühlmann sind deshalb "interpretierbares maschinelles Lernen" und "faire Algorithmen" zwei grosse Forschungsfragen, die ihn persönlich sehr interessieren: "Als Grundlagenforscher will ich etwas Sinnvolles für die Gesellschaft produzieren. Ich will wissen, wann eine Anwendung zuverlässige Resultate liefert und wann weniger", sagt Bühlmann, "das ist meine Haltung."
Innovationen ermöglichen: ETH+ Grants
Die Initiative ETH+ unterstützt interdisziplinäre Projekte von Studierenden, Forschenden und anderen ETH-Angehörigen, die dazu beitragen, dass die ETH das Innovationspotenzial an den Grenzen der Disziplinen und Departemente besser ausschöpfen kann.
Die neuen ETH+ Grants fördern interdisziplinäre Forschung: Sie unterstützen Projekte, an denen sich mindestens drei Forschende aus verschiedenen ETH-Departementen oder Gruppen beteiligen.
Ein ETH+ Grant kann bis zu 3 Mio. Franken für drei bis vier Jahre und drei Viertel der Projektkosten umfassen. Er kann für Postdoktorierende und/oder erfahrene Forschende verwendet werden. ETH-Forschende können sich zweimal pro Jahr bewerben. Nächste Eingabetermine: 1. März und 1. September 2019.
Weitere Informationen (auf Englisch).
.