SAN FRANCISCO - Alphabets Google hat am Mittwoch die zweite Generation seines künstlichen Intelligenzmodells Gemini vorgestellt und eine Reihe neuer Möglichkeiten für den Einsatz von KI jenseits von Chatbots angekündigt, darunter auch eine Brille.
CEO Sundar Pichai bezeichnete den Moment in einem Blogbeitrag als den Beginn einer "neuen Ära der Agenten" und bezog sich dabei auf virtuelle Assistenten, die Aufgaben mit größerer Autonomie ausführen können.
"Sie können mehr über die Welt um Sie herum verstehen, mehrere Schritte im Voraus denken und in Ihrem Namen und unter Ihrer Aufsicht Maßnahmen ergreifen.
Die Veröffentlichungen unterstreichen die Methoden, mit denen Google versucht, die Führung im Rennen um die Vorherrschaft in dieser aufstrebenden Technologie zurückzuerobern. Das von Microsoft unterstützte Unternehmen OpenAI erregte weltweit Aufmerksamkeit, als es im November 2022 den Chatbot ChatGPT veröffentlichte.
Google enthüllte Gemini im Dezember 2023 und bietet nun vier Versionen an.
Am Mittwoch veröffentlichte es ein Update für Flash, sein zweitgünstigstes Modell, mit verbesserter Leistung und zusätzlichen Funktionen zur Verarbeitung von Bildern und Audio. Weitere Modelle werden nächstes Jahr folgen.
OpenAI hat in den letzten Tagen eine Reihe neuer Angebote angekündigt, um seine Aussichten zu diversifizieren, darunter ein ChatGPT-Abonnement im Wert von 200 Dollar pro Monat für fortgeschrittene Forschungszwecke und die Verfügbarkeit seines Text-zu-Video-Modells Sora.
Google versucht, seine KI-Fortschritte in Anwendungen einzubringen, die bereits weit verbreitet sind. Die Suche, Android und YouTube gehören zu den sieben Produkten, die nach Angaben des Unternehmens von mehr als 2 Milliarden Menschen monatlich genutzt werden.
Diese Nutzerbasis ist ein bedeutender Vorteil gegenüber herausfordernden Startups wie dem Such-Startup Perplexity, das eine Bewertung von 9 Milliarden Dollar anstrebt, und neueren Forschungslabors wie OpenAI, Anthropic oder Elon Musks xAI.
Das Gemini 2.0 Flash-Modell wird Anwendungen wie KI-Übersichten in seiner Suchmaschine unterstützen.
Alphabets größte Wette ist KI für die Suche, sagte Ruth Porat, die Präsidentin und Chief Investment Officer, am Dienstag auf der Reuters NEXT Konferenz in New York.
Google zeigte den Reportern auch neue Funktionen für Project Astra, einen Prototyp eines universellen Agenten, der mit den Nutzern über alles, was die Smartphone-Kamera aufnimmt, in Echtzeit sprechen kann.
Das Tool kann nun ein Gespräch in verschiedenen Sprachen führen und Informationen aus Maps und dem Bilderkennungsprogramm Lens verarbeiten, sagte DeepMind Group Product Manager Bibo Xu gegenüber Reportern.
Und Astra wird auch auf Brillenprototypen getestet, die erste Rückkehr des Unternehmens in diesen Produktbereich seit dem Scheitern von Google Glasses. Inzwischen sind auch andere Unternehmen auf den Markt gekommen, darunter Meta, das im September einen Prototyp einer AR-Brille vorstellte.
Google zeigte den Reportern auch Project Mariner, eine Erweiterung für den Chrome-Webbrowser, die Tastenanschläge und Mausklicks automatisieren kann, ähnlich wie die Funktion "Computernutzung" des konkurrierenden Labors Anthropic, eine Funktion zur Verbesserung der Softwarecodierung namens Jules und ein Tool, das Verbrauchern bei Entscheidungen hilft, z.B. was sie tun oder welche Gegenstände sie in Videospielen kaufen sollen.