Die Lektüre von "Krieg und Frieden", dem monumentalen Roman von Leo Tolstoi, der eine halbe Million Wörter und oft mehr als 1.000 Seiten umfasst, könnte für ein neues Modell der künstlichen Intelligenz von Google eine minutenlange Angelegenheit sein.

Das Unternehmen, das sich im Besitz von Alphabet befindet, stellte am Donnerstag Gemini 1.5 vor, ein Upgrade seiner vor zwei Monaten angekündigten Suite von KI-Modellen. Mit einer einzigen Eingabeaufforderung kann ein Nutzer die KI von Google bitten, weitaus mehr Inhalte zu analysieren als bisher - 30.000 Zeilen Code, 11 Stunden Audio, eine ganze Stunde Video, so Google.

Das gilt für Pro, das mittelgroße Modell der Familie. Konkret kann Pro 1 Million Daten, so genannte Token, verarbeiten - fünfmal so viel wie Anthropic, der vielleicht engste Konkurrent in dieser Hinsicht, bei einer Abfrage seiner Claude 2.1 Technologie.

Reuters war nicht in der Lage, diese Behauptungen unabhängig zu überprüfen.

Die zunehmende Unersättlichkeit von Googles KI, die auf die Veröffentlichungen von ChatGPTs Schöpfer OpenAI und anderen folgt, spiegelt das rasante Wettrüsten im Silicon Valley wider, um die bisher leistungsfähigste - und marktfähigste - Technologie zu entwickeln.

In einem Interview mit Reuters kündigte Sundar Pichai, CEO von Alphabet, den Fortschritt als einen von mehreren "Durchbrüchen" an, die die zahlreichen Geschäftsbereiche seines Unternehmens beflügeln würden. Im Grunde, so Pichai, ermögliche das Hauptstandbein der Suchindustrie eine neue Art der Recherche.

"Sie geben den Menschen eine dramatisch breitere Sichtweise, um Fragen über die Welt zu stellen."

Ein Beispiel, das Google intern diskutiert hat, ist, wie ein Filmemacher die KI bitten könnte, einen ungeschnittenen Film wie ein Kritiker zu beurteilen, sagte Pichai. "Das ist nur ein Anwendungsfall, über den wir im Team gesprochen haben, aber die Möglichkeiten sind unbegrenzt", sagte er.

Ein anderer: die Abfrage von Finanzberichten mehrerer Unternehmen in einem Rutsch, sagte Pichai. Pressedemos zeigten, wie die KI Informationen aus einem 44-minütigen Video in etwa 59 Sekunden extrahieren konnte, sowie multimodale Eingabeaufforderungen, bei denen ein Benutzer die KI aufforderte, auf eine Kombination aus Text und Bildern zu antworten.

Alphabet will mit Gemini 1.5 nicht nur die Google-Suche und YouTube auf den neuesten Stand der Technik bringen, sondern auch Kunden für seine Cloud-Einheit gewinnen. Im Wettbewerb mit dem größeren Konkurrenten und OpenAI-Unterstützer Microsoft konnte Alphabet kürzlich eine Erholung des Umsatzwachstums in der Sparte verzeichnen.

Ab Donnerstag wird Google seine KI mit einer Million Token für eine begrenzte Anzahl von Geschäftskunden öffnen, während jeder Entwickler mit der Version 1.0 bauen und die neueste Generation einführen kann, sobald sie verfügbar ist.

Auf die Frage, wann solche leistungsstarken KI-Modelle, die in der Regel kostenintensiv sind, für Alphabet profitabel sein werden, sagte Pichai: "Das sind profitable Dinge, die wir tun. Außerdem werden wir mit der Zeit sehr, sehr effizient darin sein, diese Modelle zu betreiben."

Die Effizienz war eine weitere Verbesserung, die Google für Gemini 1.5 hervorhob. Google sagte, dass es eine weniger beschwerliche Methode für die KI eingeführt hat, um Informationen zu sammeln, die als "Mischung von Experten" bekannt ist, im Einklang mit seiner früheren Forschung und der jüngsten Ankündigung eines Konkurrenten.

Ein Mitarbeiter des Unternehmens verglich den Ansatz damit, einen Gelehrten anzurufen, um eine Frage zu beantworten, anstatt jede Person, die man kennt, anzurufen.