Der ChatGPT-Hersteller OpenAI teilte am Dienstag mit, dass er die Veröffentlichung seiner Funktion "Voice Mode" wegen technischer Probleme um einen Monat auf Juli verschiebt.

Das Unternehmen hatte ursprünglich geplant, die realistische Sprachkonversation für eine kleine Gruppe von ChatGPT Plus-Nutzern Ende Juni einzuführen, sagte aber, dass es sich verzögert, weil es Zeit braucht, um seinen Einführungsstandard zu erreichen.

"Wir verbessern zum Beispiel die Fähigkeit des Modells, bestimmte Inhalte zu erkennen und abzulehnen. Außerdem arbeiten wir an der Verbesserung des Benutzererlebnisses und bereiten unsere Infrastruktur darauf vor, auf Millionen von Nutzern zu skalieren und dabei Echtzeit-Antworten aufrechtzuerhalten", sagte OpenAI in einem Beitrag auf der Social Media-Plattform X.

Die Funktion wird zunächst einer kleinen Gruppe von Nutzern zur Verfügung gestellt, um Feedback zu sammeln. Im Herbst wird sie allen Plus-Nutzern zur Verfügung gestellt, vorbehaltlich von Sicherheits- und Zuverlässigkeitsprüfungen, so das Unternehmen.

OpenAI arbeitet außerdem an der Einführung neuer Video- und Bildschirmfreigabefunktionen.

Im Mai kündigte das Unternehmen an, ein neues KI-Modell namens GPT-4o auf den Markt zu bringen, das in der Lage ist, eine realistische Sprachkonversation zu führen und mit Text und Bild zu interagieren. Dies ist der jüngste Schritt des Unternehmens, um im Rennen um die Vorherrschaft in der aufkommenden KI-Technologie die Nase vorn zu haben.

Die neuen Audio-Fähigkeiten werden es Nutzern ermöglichen, mit ChatGPT zu sprechen und ohne Verzögerung Echtzeit-Antworten zu erhalten sowie ChatGPT zu unterbrechen, während es spricht - beides Merkmale realistischer Unterhaltungen, die für KI-Sprachassistenten eine Herausforderung darstellen. (Berichterstattung von Juby Babu in Mexiko-Stadt; Redaktion: Pooja Desai)