Data Scientists: Die Big-Data-Helden

Storys

Big Data steht auf der Prioritätenliste zahlreicher Unternehmen an erster Stelle. Dennoch kommen Big-Data-Projekte oft nur zögerlich voran oder führen nicht zu den gewünschten Ergebnissen. Es mangelt insbesondere an Kompetenzen, um aus den Daten wertvolle Erkenntnisse zu gewinnen. Grund genug, mit dem Data Scientist ein Berufsbild zu schaffen, das besonders gefragt ist.

Zu Beginn des Zweiten Weltkriegs führte der britische Geheimdienst eine Gruppe hochbegabter Wissenschaftler zusammen, darunter Alan Turing, um die Codes der deutschen Chiffriermaschine Enigma zu knacken. Auf der Suche nach Talenten organisierte der Geheimdienst zusammen mit dem «Daily Telegraph» einen Kreuzworträtsel-Wettbewerb und rekrutierte Kandidaten, die das Rätsel in weniger als zwölf Minuten gelöst hatten. Die Geschichte wurde übrigens im Film «The Imitation Game» geschildert.

80 Jahre später sind nun Unternehmen auf der Suche nach talentierten Mathematikern und Statistikern, die dabei helfen sollen, aus der riesigen Menge angesammelter Daten einen Nutzen zu ziehen. Ein Drittel der Schweizer Unternehmen priorisiert das Thema Big Data, wie aus einer Studie von MSM Research hervorgeht. Von Banken über Telekommunikationsunternehmen bis hin zu Grossverteilern: Unternehmen verlassen sich auf Informationen, die aus Daten gewonnen werden und die ihnen dabei helfen, ihre Angebote zu verbessern und Kosten zu sparen.

Als Vorbild dient etwa die Suva. Die Unfallversicherung berichtete, dass sie im Jahre 2015 durch den Einsatz von Big-Data-Technologien weitgehend automatisiert ungerechtfertigten Forderungen auf die Spur kam. Auf diese Weise konnte sie 40 Millionen Franken mehr sparen als im Vorjahr. Ein weiteres Beispiel für die erfolgreiche Umsetzung eines Big-Data-Projekts zeigen die Transports Publics Genevois (TPG). Das Genfer Verkehrsunternehmen rüstete seine Fahrzeuge und Depots mit Sensoren aus, die Daten wie etwa Fahrzeiten erfassen. Dadurch sollen Prozesse optimiert werden. Michaël Chopard, Marketingverantwortlicher bei der TPG, erklärt, dass die Diskussionen im Unternehmen durch die Analyse der Einsatzdaten sachlicher wurden. «Mithilfe der Daten können wir die Fahrten des Vortages analysieren und sie in Grafiken visualisieren. Dadurch werden wir objektiver.»

Wissenschaftliche Projekte, die schwierig umzusetzen sind

Selbst wenn Big-Data-Initiativen zunehmen, reichen viele nicht über die Pilotphase hinaus. Gemäss Gartner gehen nur 15 Prozent der Projekte in die Umsetzung. «Das könnte daran liegen, dass viele Big-Data-Projekte keinen konkreten Return on Investment erzielen, der im Voraus festgelegt werden kann», erklärt Nick Heudecker, Research Director bei Gartner. Die Projekte werden auch durch Ängste um die Sicherheit, ein Mangel an Expertise, fehlende Daten oder schlechte Datenqualität behindert.

Ausserdem sind Big-Data-Projekte technisch komplex und wissenschaftlich fundiert, wie viele Experten betonen. So wie Olivier Verscheure, der rund 20 Jahre für IBM arbeitete und heute das neue Swiss Data Science Center leitet. Das Forschungszentrum wurde vom ETH-Rat mit 30 Millionen Franken für die kommenden vier Jahre finanziert. Der Forscher vergleicht die Datenwissenschaft mit einer Reise: «Ein Data Scientist geht etappenweise vor. Er muss zuerst die Daten beschaffen, sie anschliessend bereinigen, dann vereinheitlichen, statistisch auswerten und schliesslich die Ergebnisse interpretieren sowie visualisieren. Er muss all diese Schritte beherrschen, um Einsichten zu gewinnen und daraus Empfehlungen abzuleiten.» Laut Diego Kuonen, CEO von Statoo Consulting und Professor für Data Science an der Universität Genf, müssen Unternehmen akzeptieren, dass Data-Science-Initiativen auf wissenschaftlichen Methoden beruhen, fortlaufend über Hypothesen und empirische Validierung weiterentwickelt werden, aber manchmal erst mit der Zeit einen Ertrag abwerfen.

Die beiden Experten stehen den Deep-Learning-Methoden skeptisch gegenüber, welche die Webgiganten für die automatische Bilderkennung einsetzen. Wie interessant diese Konzepte auch sein mögen, die von solchen Systemen erzeugten Ergebnisse könnten kaum sinnvoll interpretiert und validiert werden. Wenn man nur nach Inhalten in sozialen Netzwerken suche, sei diese Einschränkung nicht so gravierend. Soll jedoch die Zahlungsfähigkeit eines Bankkunden überprüft oder Gesundheitsdaten analysiert werden, stossen solche kognitiven Systeme an ihre Grenzen, wie sie sagen.

Der Data Scientist – viel gesucht, selten gefunden

Data Science ist ein komplexes Sachgebiet. Dies erklärt, warum sich viele Unternehmen schwertun, einen wirtschaftlichen Vorteil aus ihren Datenbeständen zu ziehen. Gemäss einer Studie der MIT Sloan Management Review fehlt es nicht an Daten, sondern an Mitarbeitern, die in der Lage sind, eine Wertschöpfung aus der Datenflut zu generieren. «Die Technologie ist kaum noch ein Hindernis, um einen ökonomischen Nutzen aus den Daten zu gewinnen. Die grösste Hürde ist der Mangel an erforderlichen Kompetenzen.» Mit anderen Worten: Wird das Geschäft mit den Daten als Goldgrube bezeichnet, sind Data Scientists die Goldgräber. Ohne sie liegen die Schätze brach.

Viele Hoch- und Fachhochschulen wollen die wachsende Nachfrage bedienen und gründen Studienfächer im Bereich Datenanalyse. In der Schweiz bietet die Berner Fachhochschule (BFH) bereits seit Herbst 2015 einen Master of Advanced Studies (MAS) für Datenspezialisten an. Die Zürcher Hochschule für angewandte Wissenschaften (ZHAW) lancierte ihren MAS-Studiengang in Data Science im vergangenen Herbst. Die Universität Genf bietet demnächst ein Masterstudium in Business Analytics an. Im kommenden Herbstsemester führen die École polytechnique fédérale de Lausanne (EPFL) sowie die Eidgenössische Technische Hochschule Zürich (ETH) einen Master in Data Science ein.

Zurzeit rekrutieren Unternehmen auf der Suche nach Data Scientists vor allem Hochschulabsolventen der Mathematik und Statistik. Denn «Learning by Doing» reicht kaum noch aus, um die erforderlichen analytischen Fähigkeiten zu erwerben. Gemäss einer Studie von Analyticsweek hatten im Jahre 2015 drei Viertel der Data Scientists einen Bachelor- oder Masterstudiengang und 19 Prozent ein Doktorat abgeschlossen. Data Scientists sollten nicht nur mathematische und statistische Fähigkeiten besitzen, sondern auch Programmierkenntnisse, etwa in Python, R und Matlab, sowie Erfahrungen im Umgang mit Big-Data-Technologien wie Hadoop mitbringen. Ebenso wird von ihnen erwartet, dass sie sich für ökonomische Fragen interessieren und Soft Skills wie Neugierde, Ausdauer, Kreativität oder kommunikative Kompetenzen vorweisen können. Gefragt sind aussergewöhnliche Talente, gibt Cécile Vermeil zu verstehen. Vermeil leitet die HR-Abteilung der IT-Firma Itecor, die im Bereich Big Data auch beratend tätig ist. «Um sie zu behalten, muss man ihnen immer wieder neue Herausforderungen bieten, um ihren Intellekt zu stimulieren», wie sie ergänzt.

Dies bestätigt auch die Studie der MIT Sloan Management Review. Gemäss den Ergebnissen der Befragung fällt es vier von zehn Organisationen schwer, Mitarbeiter mit Know-how im Bereich Analytics zu finden. Blaise Guignard, Head of Business Development bei Itecor, kennt den Mangel an geeigneten Kandidaten aus eigener Erfahrung. Er erzählt von einem Big-Data-Projekt, das monatelang auf Eis lag. Erst nachdem der Auftraggeber einen Data Scientist hatte verpflichten können, der als Ansprechpartner für die Mitarbeiter unterschiedlicher Abteilungen bereitstand, kam das Projekt ins Rollen. Den führenden Unternehmen im Markt für Big Data fällt es leichter, kompetente Mitarbeiter zu gewinnen und zu halten, wie die MIT-Studie zeigt. Der Wettbewerb um Talente ist folglich hart, insbesondere für Start-ups, die um Big Data entstanden sind und mit innovativen Projekten junge Absolventen anlocken wollen.

Data Scientists integrieren

Data Science ist auch ein Teamsport. Einerseits arbeiten Data Scientists mit Führungskräften zusammen, welche die Forschungsrichtung vorgeben. Andererseits müssen Data Scientists eng mit den Teams aus der IT kooperieren. Denn nur sie wissen, wo die Daten sind und wie sie gespeichert werden. Die Zusammenarbeit mit Entscheidungsträgern und Entwicklerteams ist sowohl für den Erfolg der Projekte als auch für die Zufriedenheit der Data Scientists ausschlaggebend, wie aus der MIT-Studie hervorgeht. Allerdings sollten die Datenspezialisten nicht zu stark in die Unternehmen eingebunden werden. Experten empfehlen, Data Science als ein separates Kompetenzzentrum aufzubauen, statt sie etwa in die IT einer Organisation zu integrieren. Auf diese Weise können Unternehmen von den Fähigkeiten der Data Scientists profitieren, während die Spezialisten ein gewisses Mass an Unabhängigkeit bewahren. Gemäss Diego Kuonen könnten Unternehmen, die über ein entsprechendes Budget verfügen, ein ganzes Team von Data Scientists einsetzen. Im besten Fall könnten sie Datenexperten mit komplementären Fähigkeiten beauftragen. So könnten sich etwa Spezialisten für Statistik und solche für die Programmierung gegenseitig ergänzen.

Alternatives Sourcing

Für kleinere Unternehmen oder solche, die neu in den Big-Data-Markt einsteigen, bietet das Outsourcing eine interessante Alternative zum Aufbau einer eigenen Data-Science-Abteilung. Dies gilt auch für Unternehmen, die nur sporadisch mit Big Data arbeiten oder sehr spezifische Leistungen beziehen wollen. Um diesen Bedarf abzudecken, gründeten einige Westschweizer IT-Anbieter auf Big Data spezialisierte Organisationen. Dazu gehört etwa die Firma Itecor. Sie erhält nach eigenen Angaben mehr und mehr Support-Anfragen von Kunden, vor allem in den Bereichen Customer-Relationship-Management, Sicherheit und industrielle Instandhaltung.

Eine weitere Option, die besonders für komplexe Probleme innerhalb der Data Science angewandt wird, heisst Open Innovation. Seit Jahren kooperiert etwa Syngenta mit externen Partnern, um Analytics-Tools zu entwickeln. Das Schweizer Agrochemie-Unternehmen konnte mittels Crowdsourcing eine Lösung entwickeln, welche die Erträge in der Landwirtschaft steigert. Diese Lösung soll etwa Informationen für die Anzucht von Soja- und anderen Pflanzen ermitteln und auf diese Weise die Erfolgschancen der Agrarproduktion erhöhen. Der Beizug von externen Spezialisten bringt den Vorteil, dass die Unternehmen von der Forschung der Experten profitieren können, ohne hohe Fixkosten für personelle und technologische Ressourcen zu veranschlagen.

Die australische Firma Kaggle setzt ebenfalls auf das Prinzip Crowdsourcing. Sie veranstaltet auf ihrer Website Data-Mining-Wettbewerbe. Unternehmen und Forschungseinrichtungen stellen dort bislang ungelöste Aufgaben und entsprechende Datensätze bereit. Für die Lösungen vergeben die Auftraggeber hochdotierte Preise. Tausende Data Scientists schliessen sich der «Kaggle-Community» an, um die Problemstellungen zu bewältigen. Gemäss Anthony Goldbloom, CEO und Gründer von Kaggle, sind solche Wettbewerbe in zwei Fällen besonders förderlich: Erstens, wenn die Datensätze wertvoll sind und ein Unternehmen das Maximum aus ihnen schöpfen will, und zweitens, wenn ein Unternehmen besonders komplexe Probleme auf der Grundlage von Daten lösen will. Derzeit konkurrieren beispielsweise über 800 Teams in einem Wettbewerb, der von der spanischen Bank Santander lanciert wurde. Die Herausforderung besteht darin, ein System zu entwickeln, womit die Bankmitarbeiter ihren Kunden Finanzprodukte empfehlen können. Die Lösung soll vorhersagen, welche Produkte die Bankkunden im nächsten Monat erwerben wollen. Die Grundlage für die Prognosen bilden Daten zum vergangenen Kaufverhalten der Kunden sowie die Nutzerprofile ähnlicher Kunden. Auch der deutsche Industriekonzern Bosch startete einen Wettbewerb auf Kaggle. Als Ziel gab der Hersteller eine Lösung vor, die Produktionsfehler vorhersagen soll. Bosch stellt für die Wettbewerbsteilnehmer Messdaten bereit, die das Unternehmen entlang der Produktionskette sammelt.

Um die viel gesuchten Data Scientists aufzustöbern, greifen wir in gewisser Weise auf die Methoden zurück, die der britische Geheimdienst vor rund 80 Jahren verwendete.

Masterstudiengänge Data Science in der Schweiz (Auswahl)

Die ETH Zürich und die EPF Lausanne starten ihre Masterstudiengänge Data Science im kommenden September. Pro Semester betragen die Kosten in Zürich 644 Franken und in Lausanne 633 Franken, inklusive der obligatorischen Beiträge für den akademischen Sportverband ASVZ, Stipendienfonds und einem Beitrag für den Studierendenverband VSETH. Für die Zulassung fallen zudem einmalige Anmeldegebühren an. Studienanwärter mit einer schweizerischen Maturität müssen dafür 50 Franken bezahlen, für jene mit einem ausländischen Diplom kostet die Anmeldung 150 Franken.

Die Universität Zürich bietet im Rahmen des Masterstudiengangs Informatik seit vergangenem September einen Studienschwerpunkt Data Science an. Absolventen dieses Studiengangs erhalten den Titel Master of Science (MSc) in Informatik mit Schwerpunkt Data Science. Die Kosten für ein Studium an der Universität Zürich betragen 769 Franken pro Semester inklusive der obligatorischen Zusatzbeiträge.

Die Berner Fachhochschule (BFH) bot als erste Bildungseinrichtung in der Schweiz einen Master of Advanced Studies in Data Science an. Der Studiengang startete im Oktober 2015. Der nächste Studienbeginn ist im April. Für einen MAS Data Science müssen Studierende der BFH vier CAS-Module (Certificates of Advanced Studies) absolvieren und eine Master-Thesis verfassen. Die CAS-Module dauern jeweils ein Semester und kosten 5500 Franken. Für die Master-These müssen die Kandidaten 4000 Franken aufwenden. Insgesamt kostet die Ausbildung zum Data Scientist an der BFH also 26 000 Franken. Hochschulabsolventen, die einen BA oder MA in einem ähnlichen Fach wie etwa Statistik oder Mathematik haben, werden ohne Zusatzbedingungen für die Immatrikulation zugelassen. Bei Studienanwärtern ohne entsprechende Vorbildung entscheiden die Studienleiter «sur Dossier» über die Zulassung. In diesem Fall ist eine zwei- bis dreijährige Berufserfahrung entscheidend, wie Andrea Moser, Studienkoordinatorin bei der BFH, auf Anfrage mitteilt.

Die ZHAW School of Engineering lancierte ihren MAS-Studiengang in Data Science im vergangenen Herbst. Studierende der ZHAW müssen ebenfalls vier CAS-Module absolvieren und eine Masterthesis einreichen. Die Ausbildung kostet insgesamt 26 800 Franken. Für die Zulassung müssen auch Hochschulabsolventen Berufserfahrungen von mindestens zwei Jahren vorweisen. Interessenten, die keinen Hochschulabschluss haben, müssen folgende Voraussetzungen erfüllen: Abschluss einer höheren Fachausbildung, mindestens vier Jahre Berufserfahrung und ein Nachweis über die Fähigkeit zum wissenschaftlichen Arbeiten. Angehende Datenspezialisten sollten Grundkenntnisse im Programmieren sowie eine Affinität zu Datenbanken und zur Datenanalyse haben, heisst es auf der Website zum Studiengang.

Artikel teilen: