Update: Alibaba verspricht leistungsstärkeres KI-Modell als Deepseek
Das KI-Modell des chinesischen Jungunternehmens Deepseek sollen mindestens so leistungsfähig sein wie jene hinter ChatGPT und Co, jedoch deutlich weniger Ressourcen benötigen. Doch auch das bekannte Unternehmen Alibaba verspricht mit seinem KI-Modell beträchtliche Leistungen.
Update vom 29.01.2025: "Wer hat die beste KI im ganzen Land?" Der Wettbewerb um diese Frage legt an Intensität zu. Nachdem das chinesische Start-up-Unternehmen Deepseek grosse Sprachmodelle präsentierte, die jene des Rivalen OpenAI in puncto Leistung übertreffen, aber nur einen Bruchteil deren Ressourcen benötigen, stellt der chinesische Tech-Gigant Alibaba nun ebenfalls ein neues KI-Modell vor, nämlich "Qwen 2.5-Max's". Das Modell übertreffe die Leistung der chinesischen Konkurrenz Deepseek V3 in fast allen Bereichen und sei auch stärker als die aktuellen KI-Modelle von OpenAI oder Meta, wie Alibaba mitteilt.
"Reuters" merkt an, dass Alibaba die Neuheit zum Start des chinesischen Neujahrsfest vorstellte, einem Feiertag, den Angestellte üblicherweise zuhause verbringen. Dass die Ankündigung jetzt komme, sei ein Indiz dafür, dass Alibaba durch den Deepseek-Erfolg der letzten Wochen unter Druck gerate, analysiert das Portal. Bereits im Frühling 2024 als Deepseek sein KI-Modell "Deepseek V2" vorstellte, hatte das laut dem Bericht Auswirkungen auf Alibabas Produkte: Da "Deepseek V2" quelloffen verfügbar war, sah sich Alibaba gezwungen, die Preise seiner KI-Produkte auf dem lokalen Markt drastisch (laut "Reuters" um bis zu 97 Prozent) zu senken.
Auch Bytedance - hierzulande vor allem bekannt für die Social-Media-App Tiktok - veröffentlichte wenige Tage nach dem Erscheinen von "Deepseek R1" eine neue Version seines KI-sprachmodells und gab an, dieses übertreffe die Leistungen des OpenAI-Produkts "O1".
Derweil ist auch Deepseek selbst nicht untätig. Wie "Heise" berichtet, veröffentlichte das Unternehmen inzwischen auch noch ein Sprachmodell namens "Janus-Pro", einen Bildgeneratoren, der es Dall-E 3 von OpenAI aufnehmen können. Auch dieses KI-Modell bietet Deepseek quelloffen an.
Originalmeldung vom 28.01.2025:
Deepseek fordert ChatGPT und Co. Heraus
Wenn ein Unternehmen ein eigenes grosses Sprachmodell lanciert, ist das heutzutage meist keine grosse News mehr. Anders verhält es sich mit Deepseek, dessen KI-Produkte Deepseek V3 oder Deepseek R1 seit Tagen schon für Schlagzeilen sorgen – und nicht nur dafür: Auch die Aktienkurse namhafter KI-Unternehmen wie Nvidia kamen in den letzten Tagen ins Schlingern, wie etwa "Euronews" berichtet.
Der Hauptgrund für den Aufruhr ist, dass die Deepseek-KI-Modelle in verschiedenen Leistungstests besser abzuschneiden scheinen als grosse Sprachmodelle bekannter Hersteller. Gleichzeitig lasse sich Deepseeks KI mit deutlich weniger Ressourcen ausführen – es sind also weniger leistungsfähigere Prozessoren dafür nötig.
Ausserdem stellt Deepseek seine fertig trainierten KI-Modelle quelloffen (Open Source) zur Verfügung. Damit können sie alle auf ihrer eigenen Hardware ausführen und für spezifische Anwendungsfälle weiter entwickeln.
Die Chip-Not zur Tugend gemacht
Zu alledem kommt noch der Umstand, dass das Jungunternehmen Deepseek in China beheimatet ist. Gegründet wurde das Unternehmen 2023 von Liang Wenfeng, wie einem Porträt von "Wired" zu entnehmen ist. Er habe Deepseek für die Forschung und aus Neugier gestartet, nicht um kurzfristig Gewinn zu machen, zitiert das Portal den Gründer aus einem Interview.
Ginge es nach den USA, sollten chinesische Unternehmen in puncto KI keine grossen Sprünge machen können - zumindest nicht mit westlicher Technologie. Dafür sorgen die Vereinigten Staaten, indem sie den Chip-Export nach China einschränken. Doch wie "Wired" aufschlüsselt, scheint genau dies Deepseek zum Erfolg verholfen zu haben: Das Unternehmen habe für seine Entwicklungen 10'000 A100-Chips von Nvidia zur Verfügung gehabt, heisst es im Artikel – das ist wenig im Vergleich zu den vielen Ressourcen grosser westlicher Player. Das Startup machte aus der Not eine Tugend und bemühte sich daraufhin, ihre KI möglichst effizient zu entwickeln, um die Nachteile der vergleichsweise schwächeren Prozessoren auszugleichen.
Dass dies dem Player aus China gelungen ist, schockiere viele westliche Unternehmen, heisst es in einer Analyse von Ben Thompson. Deepseek zeige nicht nur, wozu China fähig sei. Generell habe das Unternehmen bewiesen, dass nicht die teuerste Hardware nötig sei, um die Leistung eines KI-Modells zu steigern.