Googles Chatbot, der plaudert wie ein Mensch
Forscher von Google haben Meena entwickelt: einen Chatbot, der in der Lage ist, menschlich anmutende Gespräche über eine Vielzahl von Themen zu führen. Das Modell des neuronalen Netzes im Herzen von Meena verarbeitete 341 Gigabyte Text aus sozialen Medien.
Wird Meena dereinst wie die intelligente Assistentin im Film "Her", verkörpert durch die sexy Stimme von Scarlett Johansson, plaudern können? Das ist zumindest das Ziel der Google-Forscher, die den sogenannten Chatbot entwickeln, damit er über jedes beliebige Thema chatten und eine Erfahrung bieten kann, die einer Interaktion mit einem Menschen nahe kommt.
Meena wurde vom Brain Team von Google Research entwickelt. Das Ziel des Projekts ist es, die Grenzen zu überwinden, die den heutigen, meist hoch spezialisierten Chat-Agenten anhaften. Deren Antworten sind nur für den spezifischen Bereich, für den sie trainiert werden, relevant. Ein Chatbot, der weniger spezialisiert, dafür aber in der Lage ist, über eine Vielzahl von Themen zu sprechen, könnte zu vielen interessanten Anwendungen führen, sagen die Google-Forscher. Dazu gehören die "Humanisierung" der Mensch-Computer-Interaktion ebenso wie die Verbesserung des Fremdsprachenlernens oder die Schaffung immer glaubwürdigerer Charaktere für interaktive Filme und Videospiele.
Laut ihren Schöpfern ist Meena bereits in der Lage, richtige Gespräche zu führen, die Sinn ergeben (das heisst, über eine einzige Frage und Antwort hinaus). Sie basiert auf der sogenannten "Evolved Transformer Seq2seq"-Architektur. Dabei handelt es sich um ein bei Google entwickeltes neuronales Netz-Modell, das den Grad der Unsicherheit bei der Vorhersage des nächsten Wortes in einem Gespräch verringern soll. Dieser Wert kann in "Seq2seq"-Modellen automatisch als "Perplexitätsmetrik" gemessen werden, erklären die Forscher. Mit 2,6 Milliarden Parametern hat Meena 341 Gigabyte Text aus sozialen Medien verarbeitet. Laut ihren Entwicklern wäre die künstliche Intelligenz im Herzen des Chatbots viel leistungsfähiger als der Textgenerator GPT-2 von OpenAI (der als zu gefährlich für eine Veröffentlichung angesehen wird).
Federer zu mögen, ist ein Pluspunkt
Um Meenas "menschliche" Konversationsfähigkeiten zu bewerten und mit anderen künstlichen Intelligenzen zu vergleichen, entwickelte das Brain Team ein eigenes Bewertungssystem, den "Sensibilitäts- und Spezifizitätsdurchschnitt (SSA)". Die Experten beurteilten die Mensch-Chatbot-Gespräche danach, ob die Aussagen des Bots Sinn ergaben und spezifisch waren. Wenn der Chatbot zum Beispiel zu der Bemerkung "Ich mag Tennis" hinzufügt: "Es ist schön", wird diese Antwort als aussagekräftig, aber nicht spezifisch beurteilt. Dagegen wird "Auch ich werde nie müde, Roger Federer zuzuschauen" als spezifisch bezeichnet, weil die Aussage eng mit dem Thema der Diskussion zusammenhängt.
Der ideale Weg, solche Chatbot-Modelle zu verbessern und ihre Fähigkeit, menschlich zu chatten, zu verfeinern, wäre eine automatische Bewertungsmetrik, die mit dem menschlichen Urteilsvermögen korreliert. Google-Forscher haben einen mehr als interessanten Ansatz in dieser Hinsicht entdeckt. Sie stellten fest, dass die mit ihrem SSA-System ermittelte Punktzahl stark mit dem anhand einer Formel berechneten Grad der Ratlosigkeit korreliert. Es scheint, dass die SSA-Werte des Modells umso besser ausfallen, je geringer die Ratlosigkeit ist. Die Meena-Entwickler planen nun, ihre Forschung fortzusetzen, indem sie sich auf die Verbesserung von Algorithmen, Architekturen, Daten und Rechenleistung konzentrieren. Das Ziel sei es, die Ratlosigkeit in gesprächsorientierten neuronalen Netzwerken zu reduzieren.