Google Gemini 2.0: Ein neues KI-Modell für das "Agenten-Zeitalter"
Google hat Gemini 2.0 Flash, die neueste Version seines KI-Modells, veröffentlicht. Das Modell konzentriert sich darauf, Entwicklern die Möglichkeit zu geben, sogenannte "agentische" Anwendungen in AI Studio und Vertex AI zu erstellen, wie The Register berichtet. ("Google Gemini 2.0 Flash shines", The Register, 11. Dezember 2024). Diese Agenten sollen mehrschrittige Aufgaben basierend auf komplexen Anweisungen unter Verwendung externer Daten und Tools bewältigen können. Demis Hassabis, CEO von Google DeepMind, und Koray Kavukcuoglu, CTO von Google DeepMind, sehen großes Potenzial in der praktischen Anwendung solcher KI-Agenten, so The Register.
Gemini 2.0 Flash ist multimodal und kann Text, Bilder und Audio sowohl verarbeiten als auch generieren. Eine Multimodal Live API ermöglicht Echtzeit-Konversationen und Bildanalysen. Darüber hinaus unterstützt das Modell die Nutzung von Tools wie Codeausführung und Suche. Laut Logan Kilpatrick, Produktmanager für AI Studio und Gemini API, soll AI Studio Entwicklern den Zugang zu den neuesten Google-Modellen ermöglichen (The Register, 11. Dezember 2024). Gemini 2.0 Flash erscheint etwa ein Jahr nach dem ersten Gemini-Modell und reiht sich in die Modellfamilie ein, zu der unter anderem Gemini 1.0 Ultra, Gemini 1.5 Pro und Gemini 1.0 Nano gehören.
Cryptopolitan berichtet, dass Gemini 2.0 Flash doppelt so schnell wie Gemini 1.5 Pro ist und eine verbesserte Leistung bietet. ("Google launches Gemini 2.0, a model for “everything”", Cryptopolitan). Mit der Einführung von Gemini 2.0 Flash startet Google auch Jules, einen KI-gestützten Code-Agenten zur Unterstützung von Entwicklern. Zusätzlich werden "agentische Data-Science-Funktionen" in Google Colab integriert, und das neue Modell wird in Gemini Code Assist, Googles KI-Codierungserweiterung für VS Code, IntelliJ PyCharm und andere IDEs, verfügbar sein.
Shrestha Basu Mallick, Group Product Manager für Gemini API, demonstrierte die Fähigkeiten von Gemini 2.0 Flash anhand von Beispielen wie einem 20-Fragen-Spiel, dem Zählen von Fingern in einem Videostream und der Bestimmung der Farbe von Fingernägeln (The Register, 11. Dezember 2024). Eine weitere Demonstration zeigte die multimodalen Fähigkeiten des Modells bei der Rezeptgenerierung, einschließlich visueller Darstellungen der Zutaten. Neben Gemini 2.0 wurde auch Project Astra vorgestellt, eine experimentelle "Alles-App", die Google bereits im Mai auf der Google I/O angedeutet hatte, wie MIT Technology Review berichtet. (MIT Technology Review, 11. Dezember 2024). Astra nutzt das in Gemini 2.0 integrierte Agenten-Framework, um Fragen zu beantworten und Aufgaben über Text, Sprache, Bild und Video auszuführen, und greift bei Bedarf auf bestehende Google-Apps wie Search, Maps und Lens zurück.
Last Week in AI fasst die wichtigsten Ankündigungen zusammen, darunter die verbesserte Multimodalität von Gemini 2.0, die es ihm ermöglicht, Video und Audio zu interpretieren und Sprache zu verarbeiten. ("Last Week in AI #298", Last Week in AI, 11. Dezember 2024). Hervorgehoben wird auch die Vorstellung von Project Mariner, einer Chrome-Erweiterung, die im Auftrag des Benutzers im Web navigieren kann. Wccftech berichtet über geleakte Screenshots, die darauf hindeuten, dass Google die Veröffentlichung von Gemini 2.0 möglicherweise zeitlich näher an die Veröffentlichung des kommenden o1-Modells von OpenAI legen könnte. (Wccftech, 12. November 2024). Dies würde einem ähnlichen Muster folgen wie bei der Veröffentlichung von Gemini 1.5 Pro kurz vor GPT-4o.
Auf Hacker News werden die Fähigkeiten von Gemini 2.0, insbesondere die Codeausführung und Bildbeschreibung, diskutiert. (Hacker News, Diskussion zu "Gemini 2.0: our new AI model for the agentic era", 11. Dezember 2024). Es wird angemerkt, dass das Modell zwar Python-Code schreiben und ausführen kann, jedoch keine ausgehenden Netzwerkaufrufe tätigen kann.
Quellen:
* www.cryptopolitan.com/google-launches-gemini-2-0-a-model/
* www.theregister.com/2024/12/11/google_gemini_20_flash_shines/
* lastweekin.ai/p/last-week-in-ai-298-gemini-20-amazons
* www.technologyreview.com/2024/12/11/1108493/googles-new-project-astra-could-be-generative-ais-killer-app/
* www.reddit.com/r/DailyTechNewsShow/comments/1hby1gv/google_launched_gemini_20_its_new_ai_model_for/
* news.ycombinator.com/item?id=42388783
* wccftech.com/leaked-screenshots-suggest-that-google-might-launch-gemini-2-0-closer-to-openais-upcoming-o1-model-release-window/