Das Tool mit dem Namen Operator wird von einem Modell angetrieben, das es ihm ermöglicht, mit Schaltflächen, Menüs und Textfeldern auf dem Bildschirm zu interagieren.
"Diese Fähigkeit markiert den nächsten Schritt in der KI-Entwicklung. Sie ermöglicht es den Modellen, dieselben Werkzeuge zu nutzen, auf die sich Menschen täglich verlassen, und öffnet die Tür zu einer Vielzahl von neuen Anwendungen", so das Unternehmen in einem Blogbeitrag.
Operator kann eine Vielzahl von Aufgaben erledigen, wie z.B. To-Do-Listen erstellen oder bei der Urlaubsplanung helfen. Er nimmt auch Benutzereingaben entgegen, sobald er entscheidet, dass eine Aufgabe abgeschlossen ist, und bittet bei einigen Aufgaben um Bestätigung, z. B. bei der Eingabe von Anmeldedaten auf einer Website.
Das Tool ist derzeit für Pro-Nutzer in den USA als Forschungsvorschau verfügbar, so das von Microsoft unterstützte Startup.
Agenten, d.h. Systeme, die ohne direktes menschliches Eingreifen Aktionen wie Einkäufe oder Terminvereinbarungen durchführen können, stehen heute ganz oben auf der KI-Agenda von Unternehmen.
Der OpenAI-Konkurrent Perplexity hat bereits am Donnerstag einen agentenbasierten Assistenten für Android-Geräte vorgestellt. Dieser Assistent kann unter anderem Essensreservierungen vornehmen, Fahrten über Apps bestellen und Erinnerungen einstellen.
Letztes Jahr hat Apple die Apple Intelligence in seinen Sprachassistenten Siri integriert und - im Rahmen einer Partnerschaft mit OpenAI - hat der iPhone-Hersteller auch die Verwendung von ChatGPT eingeführt, wenn der Nutzer dies erlaubt.
Während solche Agenten lange Zeit für Forscher schwer fassbar waren, könnte das Aufkommen von schrittweisen Denkansätzen, wie sie im o1-Modell von OpenAI verwendet werden, solche Aufgaben möglich machen, sagten Führungskräfte aus der Wirtschaft im Dezember gegenüber Reuters.