Nova

Amazon schickt eigenes Basismodell ins GenAI-Rennen

Uhr
von René Jaun und dwi

An der AWS-Entwicklerkonferenz Re:Invent 2024 hat Amazon ein eigenes Basismodell für künstliche Intelligenz vorgestellt. Es heisst "Nova", ist in verschiedenen Ausführungen erhältlich und soll jetzt schon über 200 Sprachen verstehen.

Re:Invent 2024. (Source: AWS)
Re:Invent 2024. (Source: AWS)

Amazon tritt in den Anbietermarkt für künstliche Intelligenz (KI) ein. Der US-amerikanische Tech-Konzern präsentierte anlässlich der Entwicklerkonferenz Re:Invent 2024 des Hyperscalers Amazon Web Services (AWS) ein eigenes Basismodell namens "Amazon Nova". Wie der Mitteilung zu entnehmen ist, ist Nova aktuell über die AWS-KI-Plattform Bedrock verfügbar.

Die Stärken von Nova sind vielfältig: Von der Analyse komplexer Dokumente über das Erstellen von Videos bis zum Entwerfen aufwändiger KI-Agenten ist vieles möglich, wie es in einem AWS-Blogbeitrag heisst. Ausserdem erreiche Nova eine geringere Latenz und könne Kosten senken.

Amazon bietet Nova in verschiedenen Ausführungen an. Das einfachste Modell heisst "Nova Micro". Es akzeptiert Text-Input und generiert auch Text-Output. Es sei "für Geschwindigkeit und Kostensparsamkeit optimiert", wie AWS schreibt. Die nächste Stufe heisst "Nova Lite". Dieses Modell  kann auch Bilder und bis zu 30 Minuten lange Videos verarbeiten, produziert aber nur Text-Antworten. Auch diese Ausführung punktet mit hoher Geschwindigkeit. Im Rahmen einer Keynote an der Re:Invent 2024 verglich Amazon-CEO Andy Jassy das Modell unter anderem mit GPT4o-Mini von KI-Rivale OpenAI.

Noch einmal stärker ist "Nova Pro", ein "hochgradig leistungsfähiges, multimodales Modell mit der besten Kombination aus Genauigkeit, Geschwindigkeit und Kosten für ein breites Spektrum an Aufgaben", wie es bei Amazon heisst. Es verarbeite bis zu 300'000 Eingabetoken und eigne sich unter anderem für agentenbasierte Workflows, die den Aufruf von APIs und Tools zur Durchführung komplexer Aufgaben erfordern. Das Modell kann mit Text, Videos und Bildern umgehen, analysiert aber auch Finanzdokumente oder Programmcodes mit bis zu 15'000 Zeilen. Auch dieses Modell produziert Text-Antworten. An der Keynote verglich der Amazon-CEO Nova Pro mit GPT4o.

Die drei Nova-Modelle sind per sofort in Bedrock verfügbar, allerdings vorerst nur in einigen US-amerikanischen Cloud-Regionen. Sprachlich scheinen die Modelle jedoch bereits für eine Expansion parat zu sein. Laut der Mitteilung verstehen und generieren die Modelle über 200 Sprachen. Besonders gut funktioniere dies unter anderem in Deutsch, Französisch oder Italienisch, merkt der Tech-Konzern an.

Nova macht auch Bilder und Videos

Derweil bereitet Amazon weitere Nova-Versionen vor. Anfang 2025 will das Unternehmen "Nova Premier" auf den Markt bringen, das "leistungsfähigste multimodale Modell", wie es in der Mitteilung heisst. Es eigne sich für komplexe Argumentationsaufgaben und für die sogenannte Destillation benutzerdefinierter KI-Modelle. Dabei wird ein bereits bestehendes KI-Modell für einen spezifischen Einsatzzweck umtrainiert.

All diese Nova-Varianten bezeichnet Amazon als "Understanding Models". Zu diesen Varianten gesellen sich noch die "creative content generation Models". Anders als die bisher genannten, erstellen diese kreativen Modelle keinen Text: "Nova Canvas" generiert Bilder anhand eines Text-Inputs und "Nova Reel" Videos. Letztere können zunächst bis zu 6 Sekunden, später dann bis zu 2 Minuten lang sein, wie Jassy während der Keynote ausführte.

"Nova Reel" übertreffe bestehende Modelle bei der menschlichen Bewertung von Videoqualität und Videokonsistenz, schreibt AWS. Sowohl Bilder als auch Videos punkten demnach mit ihrer hochwertigen Qualität. Auch diese Modelle sind jetzt schon in ersten US-Cloud-Regionen verfügbar. Anders als die verstehenden KI-Modelle können die kreativen Varianten aktuell nur mit englischen Prompts arbeiten.

Wer lieber spricht und zuhört, der muss sich noch bis kommendes Jahr gedulden. In der Keynote kündigte der Amazon-Chef für den Frühling 2025 eine Nova-Version an, die gesprochene Sprache versteht und ausgibt. Mitte 2025 soll schliesslich eine "any-to-any"-Version von Nova kommen, die also jegliche Art von Inputs verarbeiten und ausgeben kann.

 

Übrigens hat Milliardär Elon Musk unlängst Klage gegen den KI-Riesen OpenAI eingereicht. Musks Anwälte werfen dem Unternehmen irreparable Schäden am Markt für generative KI vor. Details dazu lesen Sie hier.

Webcode
zs5WUhTw