Predictive Analytics: Wenn Daten einen Blick in die Zukunft erlauben
Wissen, was kaputt geht, bevor es kaputt geht. Das ist eine von vielen Möglichkeiten von Predictive Analytics. Krzysztof Kryszczuk, Leiter der Predictive Analytics Group der ZHAW, spricht über Predictive Maintenance, qualitativ hochwertige Daten und leere Benzintanks.
Woran forschen Sie im Bereich Predictive Analytics im Moment?
Krzysztof Kryszczuk: Die Predictive Analytics Group ist daran interessiert, modernste maschinelle Lern- und Signalverarbeitungstechniken einzusetzen. Es geht darum, menschliche Biosignale besser zu verstehen und die Entwicklung von Algorithmen der nächsten Generation in enger Zusammenarbeit mit unseren Industriepartnern zu ermöglichen. Zum Beispiel suchen wir nach innovativen Möglichkeiten, neurodegenerative Erkrankungen mithilfe von Signalen, die von einer Smartwatch gesammelt wurden, zu diagnostizieren.
Was genau sind denn "Predictive Analytics"?
Predictive Analytics ist ein Paradigma in der Datenwissenschaft. Historisch gesehen stammen maschinelles Lernen und Mustererkennung aus der angewandten Statistik. In der Statistik beschäftigen wir uns mit "Descriptive Analytics". Hier versuchen wir, zu verstehen, was in der Vergangenheit "passiert ist" und möglicherweise auch warum. Predictive Analytics versuchen, ein Fenster zur Zukunft zu öffnen und uns zu sagen, was wahrscheinlich als Nächstes passieren wird, basierend auf dem Wissen über die Vergangenheit und die Gegenwart. Der nächste Schritt ist "Prescriptive Analytics", wo wir nicht nur vorhersagen wollen, was wahrscheinlich passieren wird, sondern auch den optimalen Aktionsplan entwickeln wollen. Ich und meine Gruppe arbeiten bereits in diese Richtung.
Können Sie das anhand eines Beispiels genauer erläutern?
Stellen Sie sich vor, Sie fahren ein Auto auf der Autobahn und die Tankanzeige zeigt "leer" an. Sie wissen, dass Sie es in der Vergangenheit immer geschafft haben, zur nächsten Tankstelle zu kommen. Das ist eine deskriptive Analyse. Sie sind auf einer Autobahn, auf der Sie noch nie gefahren sind, aber wenn Sie sich die Karte ansehen, spekulieren Sie, dass Sie es mit gleichbleibendem Fahrstil bis zur nächsten Ausfahrt schaffen sollten, bevor das Auto stehen bleibt. Das ist eine prädiktive Analyse, also Predictive Analytics. Jetzt können Sie verschiedene Dinge tun – Sie können so weiterfahren wie bisher, Sie können beschleunigen oder Sie können verlangsamen. Prescriptive Analytics wird Ihnen sagen, was das optimale Vorgehen sein sollte, damit Sie Ihren Abend nicht auf dem Autobahnstandstreifen im Regen verbringen und auf Hilfe warten müssen.
Warum ist diese Technologie für Unternehmer interessant?
Predictive Analytics helfen dabei, herauszufinden, was das wahrscheinlichste Ergebnis einer Entscheidung ist. Gute Entscheidungen sind gut für das Geschäft. Schlechte Entscheidungen können kostspielig sein. Das Ziel eines jeden Unternehmens ist es, den Gewinn zu maximieren. Eine der Möglichkeiten, zur Gewinnmaximierung beizutragen, ist die Minimierung der Kosten. Schlechte Entscheidungen basieren in der Regel auf schlechten Vorhersagen, und genau hier hilft Predictive Analytics. Wir sprechen hier natürlich über den Einsatz von Predictive Analytics als direkte Unterstützung bei der Führung des Unternehmens. Technologien wie Predictive Maintenance hingegen ermöglichen es, die Tage hinter sich zu lassen, in denen weniger optimale Entscheidungen getroffen worden sind, die auf einer Mischung aus technischer Erfahrung und altertümlicher Statistik basieren.
Was ist "Predictive Maintenance"?
Predictive Maintenance, also ein vorausschauendes Wartungssystem, ist vor allem für unentbehrliche, komplexe und teure Geräte relevant, oft in einer geschäftskritischen Anwendung. Beispiele dafür sind Flugzeugmotoren, Stromgeneratoren und so weiter. Aufgrund der Beschaffenheit dieser Geräte ist es von entscheidender Bedeutung, dass sie störungsfrei funktionieren und das erwartete Leistungsniveau liefern. Solche Geräte verfügen über einen sehr detaillierten Wartungsplan, der erklärt, wann und an welchem Teil der Maschine etwas gewartet oder ausgetauscht werden muss, um einen reibungslosen Betrieb zu gewährleisten. Solche Servicepläne werden naturgemäss nach dem "Worst-Case-Szenario" erstellt. Ein wenig konservativ zu sein, ist hier sinnvoll. Niemand will, dass ein Flugzeugmotor während des Fluges ausfällt. Dieses Vorgehen führt jedoch zwangsläufig zu Ineffizienz – oft wird eine Maschine gewartet, obwohl es noch nicht nötig ist, wenn man den aktuellen Zustand der Maschine zugrunde legt.
Und hier kommt die Predictive Maintenance ins Spiel?
Genau. Die heutigen komplexeren Maschinen sind mit einer Vielzahl von verschiedenen Sensoren ausgestattet, die live Informationen über den aktuellen Zustand des Arbeitsgeräts liefern. Wir sammeln Sensordaten, transformieren sie und extrahieren daraus Informationen, die auf eine mögliche Fehlfunktion hinweisen. Dann erstellen wir Modelle für die Verwendung von Techniken des maschinellen Lernens und setzen diese Modelle später ein, um vorherzusagen, ob und wann ein Ausfall wahrscheinlich ist. Auf diese Weise können wir Geld für unnötige Betriebsunterbrechungen und noch mehr Geld für die Vermeidung von Ausfällen zwischen geplanten Wartungszeiten sparen. Die Forscher meiner Gruppe bauten solche Modelle für grosse Gasturbinen mit dem Ziel, übermässige toxische Gasemissionen zu vermeiden. Unsere Modelle ermöglichen nicht nur die Vorhersage, wann die Emissionen kritische Werte erreichen, sondern wir gingen noch einen Schritt weiter: Wir haben ein System entwickelt, das den Ingenieuren bei der Rekalibrierung der Maschine hilft. Das Ziel dabei war, Leistung, Emissionen und Langlebigkeit der Turbine zu optimieren.
Nehmen wir an, eine Maschine gibt mithilfe von Predictive Maintenance an, dass sie in drei Monaten nicht mehr funktionieren wird. Besteht dann nicht die Gefahr, dass Betrüger eine derartige Funktion ausnützen könnten, um einen Käufer dazu zu bewegen, unnötigerweise eine weitere Maschine anzuschaffen?
Ich glaube nicht, dass dies ein wahrscheinliches Szenario ist. Typischerweise sind die Daten eines vorausschauenden Wartungssystems nicht öffentlich oder zumindest nicht leicht zugänglich. Sollten solche Informationen leaken, läge das Problem bei den Personen, die Zugang zu den Informationen haben, und nicht bei der Predictive Maintenance selbst.
Für wen lohnen sich Predictive Analytics und für wen nicht?
Ich bin wahrscheinlich nicht die kompetenteste Person, um das zu beurteilen. Aber meine Intuition in dieser Hinsicht ist Folgende: Jedes erfolgreiche Unternehmen verwendet prädiktive Analysen, ob gross oder klein, ob es sich um eine Bäckerei oder ein grosses Pharmaunternehmen handelt. Unternehmen, die nicht versuchen, ihre Entscheidungen auf der Grundlage einer versuchten Vorhersage der Zukunft zu treffen, sind wahrscheinlich sehr schnell aus dem Markt raus. Einfache Vorhersagen brauchen einfache Modelle. Übersteigt aber die Anzahl der Faktoren, die für die Erstellung einer Vorhersage berücksichtigt werden müssen, die Kapazitäten des menschlichen Gehirns, dann sind maschinelles Lernen und Mustererkennung die einzige Lösung, ausser man möchte raten. Wir Menschen sind grossartig darin, Muster zu entdecken, prädiktive Modelle in unserem Kopf aufzubauen und Entscheidungen auf der Grundlage dieser Modelle zu fällen. So haben unsere Vorfahren im Dschungel überlebt, so haben sich die Unternehmen unserer Grossväter auf dem immer stärker umkämpften Markt behauptet. Aber wir sind biologisch auf das Denken in nur zwei Dimensionen beschränkt – die Klügsten von uns vielleicht in drei. Moderne technologische und geschäftliche Entscheidungen erfordern oft die Berücksichtigung von hunderten oder tausenden Parametern und deren gegenseitigen Beziehungen und Interaktionen. Es gibt einfach keinen Menschen, der dazu in der Lage ist. Zurück zur Frage: Predictive Analytics sind wichtig für jeden, der sich keine Fehler leisten kann, denn anders ist er nicht in der Lage, alle Faktoren bei einer wichtigen Entscheidung zu berücksichtigen.
Welche Herausforderungen bringt es mit sich, wenn ein Unternehmen Predictive Analytics einsetzen möchte?
Ich würde sagen, die typischen Herausforderungen ergeben sich aus der Notwendigkeit, einen Paradigmenwechsel zu vollziehen. Viele Unternehmen feiern immer noch die Kultur der unersetzlichen Experten. Dabei handelt es sich um erfahrene Mitarbeiter, die seit vielen Jahren ihre Arbeit verrichten. Die Einführung eines Algorithmus, der die Aufgabe möglicherweise besser erfüllen kann, ist oft abschreckend und bringt die unausgesprochene Drohung mit sich, Leute in die Irrelevanz zu drängen. "Wir brauchen so etwas nicht, unsere Experten machen es grossartig." Man kann niemandem die Schuld für den Widerstand geben. Jede neue Technologie hat Gegenwehr und Verachtung ausgelöst, bevor sie akzeptiert wurde. Eine weitere Herausforderung ergibt sich aus der Notwendigkeit, Daten als wertvolle Ressource zu betrachten. Im Bereich der Datenverarbeitung haben wir ein Sprichwort: "garbage in, garbage out". Unsere Modelle und Vorhersagen sind nur so gut wie die Daten, die wir für die Arbeit erhalten. Das scheint simpel zu sein, aber das Sammeln von Qualitätsdaten ist schwierig, kostspielig und zeitaufwendig, und es erfordert einen gezielten Einsatz von Ressourcen – jedes Unternehmen, das auf den Datenzug aufspringen möchte, muss bereit sein, diese zusätzlichen Kosten zu tragen.
Wie steht es um die Wirtschaftlichkeit der Technologie?
Das hängt stark davon ab, wie schwierig das vorliegende Problem ist. Wenn qualitativ hochwertige Daten leicht verfügbar sind und das Problem relativ einfach ist, kann es kostengünstig gelöst werden. Das ist der Grund, warum die ersten Unternehmen, die auf den Zug der Predictive Analytics aufsprangen, Unternehmen waren, die im Internet tätig sind: Google, Amazon, Facebook. Sie haben einfachen Zugriff auf die Daten. Der zusätzliche Aufwand für die Einführung datengetriebener Vorhersagekapazität ist relativ kostengünstig und skaliert gut aufgrund der Hebelwirkung des Internet-Business. Unternehmen, die nicht gut skalierbar sind, scheinen am anderen Ende dieses Spektrums zu stehen, etwa die Bauindustrie.
In welchem Verhältnis stehen Big Data und Predictive Analytics?
Grosse Datenmengen erleichtern die prädiktive Analyse. Wie bereits erwähnt, waren die ersten Unternehmen, die Predictive Analytics erfolgreich nutzten, um sich einen Wettbewerbsvorteil auf dem Markt zu verschaffen, Unternehmen, die Daten gesammelt haben. Glücklicherweise für uns und unglücklicherweise für Unternehmen sind viele schwierige Probleme teilweise deshalb schwierig, gerade weil die verfügbaren Daten knapp sind und die Erhebung weiterer Daten schwierig und kostspielig ist. Meine Gruppe arbeitet im Bereich der personalisierten Medizin, und in diesem Bereich ist die Erhebung von Daten extrem schwierig – die Daten müssen von Personen gesammelt werden, die zustimmen müssen, ihre personenbezogenen Daten "zu spenden". Die Datenerhebungsverfahren müssen von Ethikkommissionen streng sanktioniert werden, die Datenspeicherung muss sicher sein und die Daten müssen anonymisiert werden, um die Wiederherstellung der Identität aus den gesammelten Daten nicht zu ermöglichen. Infolgedessen sind die Daten in diesem Bereich typischerweise knapp und oft nicht genug, um das zu tun, was wir wollen oder können. Wir haben es eher mit Small-Data-Problemen als mit Big-Data-Problemen zu tun.
Wie muss sich die IT weiterentwickeln, damit das Potenzial von Predictive Analytics voll ausgeschöpft werden kann?
Ich glaube, dass man die grössten Fortschritte aufgrund der grösseren Verfügbarkeit an hochqualitativen Daten erwarten darf. In der Vergangenheit erforderte die Beschaffung von Daten eines Prozesses oder einer Vorrichtung einen koordinierten Aufwand für die Entwicklung dedizierter Sensoren und die Erstellung von Datenerfassungsprozessen und Infrastrukturen. Hochwertige Sensoren sind heute allgegenwärtig, und mit der wachsenden Popularität des Internets der Dinge sind Daten einfacher zu erfassen und zu übermitteln als je zuvor. Ich kann hier das Beispiel der personalisierten Medizin nennen. Traditionell gehen wir zum Arzt, wenn wir einen Unfall haben oder wenn wir krank sind. Im Gegensatz zu diesem reaktiven Ansatz erkennen wir nun die Macht der Präventionsmedizin, wenn wir Vitalwerte bei gesunden Menschen überwachen und erste Anzeichen einer Verschlechterung der Gesundheit erfassen und darauf reagieren wollen. Sie unterscheidet sich nicht so sehr von der Predictive Maintenance. Die Präventionsmedizin erfordert nicht-invasive, störungsfreie Sensoren – und der Markt für tragbare Sensoren wächst rasant. Es ist einfach, Intertialsensoren, Herzfrequenzsensoren, Blutoxidationssensoren zu finden, die alle in praktische, tragbare Kundenprodukte integriert sind. Vitaldaten, die früher nur von einem Arzt und gegen Aufpreis in einer klinischen Umgebung gesammelt werden konnten, werden heute von einer Smartwatch kostengünstig gesammelt und bequem per Handy oder Computer an eine Cloud-Computing-Einrichtung übertragen, wo die Modellierungs- und Vorhersagealgorithmen ihre Wirkung entfalten.
Mit welchen Entwicklungen darf man im Bereich von Predictive Analytics in der Zukunft noch rechnen?
Niels Bohr wird die berühmte Aussage zugeschrieben: "Es ist schwer, Vorhersagen zu treffen, insbesondere wenn es die Zukunft betrifft." Predictive Analytics hat maschinelles Lernen im Kern und das maschinelle Lernen wächst extrem schnell, wahrscheinlich mit den dynamischsten Entwicklungen im Bereich der neuronalen Netze und des Deep Learning. Ich glaube, wir können mit mehr spannenden Anwendungen des Deep Learning in Predictive Analytics rechnen, besonders in Bereichen, in denen eine grosse Menge an qualitativ hochwertigen Daten vorhanden ist. Eine der Schwächen des heutigen Einsatzes von Predictive Analytics ist die statische Nutzung von Daten. Wenn neue Daten verfügbar werden, müssen die Modelle der meisten Systeme neu trainiert werden. Ich glaube, wir werden bald mehr Anwendungen sehen, bei denen die prädiktiven Algorithmen in der Lage sein werden, die Richtigkeit ihrer eigenen Vorhersagen anhand ihres Kontextes und ihrer Ergebnisse zu bewerten – und sich somit im Laufe der Zeit selbst zu verbessern. Es wird wahrscheinlich ein Schritt in Richtung einer echten Verwirklichung des überstrapazierten und missbrauchten Begriffs der "künstlichen Intelligenz" sein.