11.12.2024
Technologie

Gemini 2.0: Die nächste Generation von KI-Agenten im Fokus

Google hat Gemini 2.0 Flash vorgestellt, ein neues, multimodales KI-Modell, das auf die Entwicklung "agenter" Anwendungen fokussiert ist und Text, Bilder und Audio verarbeiten kann. Es bietet verbesserte Geschwindigkeit und Leistung im Vergleich zum Vorgänger und wird in diverse Google-Produkte integriert, darunter AI Studio, Colab und Gemini Code Assist.

Google Gemini 2.0: Ein neues KI-Modell für das "Agenten-Zeitalter"

Google hat Gemini 2.0 Flash, die neueste Version seines KI-Modells, veröffentlicht. Das Modell konzentriert sich darauf, Entwicklern die Möglichkeit zu geben, sogenannte "agentische" Anwendungen in AI Studio und Vertex AI zu erstellen, wie The Register berichtet. ("Google Gemini 2.0 Flash shines", The Register, 11. Dezember 2024). Diese Agenten sollen mehrschrittige Aufgaben basierend auf komplexen Anweisungen unter Verwendung externer Daten und Tools bewältigen können. Demis Hassabis, CEO von Google DeepMind, und Koray Kavukcuoglu, CTO von Google DeepMind, sehen großes Potenzial in der praktischen Anwendung solcher KI-Agenten, so The Register. Gemini 2.0 Flash ist multimodal und kann Text, Bilder und Audio sowohl verarbeiten als auch generieren. Eine Multimodal Live API ermöglicht Echtzeit-Konversationen und Bildanalysen. Darüber hinaus unterstützt das Modell die Nutzung von Tools wie Codeausführung und Suche. Laut Logan Kilpatrick, Produktmanager für AI Studio und Gemini API, soll AI Studio Entwicklern den Zugang zu den neuesten Google-Modellen ermöglichen (The Register, 11. Dezember 2024). Gemini 2.0 Flash erscheint etwa ein Jahr nach dem ersten Gemini-Modell und reiht sich in die Modellfamilie ein, zu der unter anderem Gemini 1.0 Ultra, Gemini 1.5 Pro und Gemini 1.0 Nano gehören. Cryptopolitan berichtet, dass Gemini 2.0 Flash doppelt so schnell wie Gemini 1.5 Pro ist und eine verbesserte Leistung bietet. ("Google launches Gemini 2.0, a model for “everything”", Cryptopolitan). Mit der Einführung von Gemini 2.0 Flash startet Google auch Jules, einen KI-gestützten Code-Agenten zur Unterstützung von Entwicklern. Zusätzlich werden "agentische Data-Science-Funktionen" in Google Colab integriert, und das neue Modell wird in Gemini Code Assist, Googles KI-Codierungserweiterung für VS Code, IntelliJ PyCharm und andere IDEs, verfügbar sein. Shrestha Basu Mallick, Group Product Manager für Gemini API, demonstrierte die Fähigkeiten von Gemini 2.0 Flash anhand von Beispielen wie einem 20-Fragen-Spiel, dem Zählen von Fingern in einem Videostream und der Bestimmung der Farbe von Fingernägeln (The Register, 11. Dezember 2024). Eine weitere Demonstration zeigte die multimodalen Fähigkeiten des Modells bei der Rezeptgenerierung, einschließlich visueller Darstellungen der Zutaten. Neben Gemini 2.0 wurde auch Project Astra vorgestellt, eine experimentelle "Alles-App", die Google bereits im Mai auf der Google I/O angedeutet hatte, wie MIT Technology Review berichtet. (MIT Technology Review, 11. Dezember 2024). Astra nutzt das in Gemini 2.0 integrierte Agenten-Framework, um Fragen zu beantworten und Aufgaben über Text, Sprache, Bild und Video auszuführen, und greift bei Bedarf auf bestehende Google-Apps wie Search, Maps und Lens zurück. Last Week in AI fasst die wichtigsten Ankündigungen zusammen, darunter die verbesserte Multimodalität von Gemini 2.0, die es ihm ermöglicht, Video und Audio zu interpretieren und Sprache zu verarbeiten. ("Last Week in AI #298", Last Week in AI, 11. Dezember 2024). Hervorgehoben wird auch die Vorstellung von Project Mariner, einer Chrome-Erweiterung, die im Auftrag des Benutzers im Web navigieren kann. Wccftech berichtet über geleakte Screenshots, die darauf hindeuten, dass Google die Veröffentlichung von Gemini 2.0 möglicherweise zeitlich näher an die Veröffentlichung des kommenden o1-Modells von OpenAI legen könnte. (Wccftech, 12. November 2024). Dies würde einem ähnlichen Muster folgen wie bei der Veröffentlichung von Gemini 1.5 Pro kurz vor GPT-4o. Auf Hacker News werden die Fähigkeiten von Gemini 2.0, insbesondere die Codeausführung und Bildbeschreibung, diskutiert. (Hacker News, Diskussion zu "Gemini 2.0: our new AI model for the agentic era", 11. Dezember 2024). Es wird angemerkt, dass das Modell zwar Python-Code schreiben und ausführen kann, jedoch keine ausgehenden Netzwerkaufrufe tätigen kann. Quellen: * www.cryptopolitan.com/google-launches-gemini-2-0-a-model/ * www.theregister.com/2024/12/11/google_gemini_20_flash_shines/ * lastweekin.ai/p/last-week-in-ai-298-gemini-20-amazons * www.technologyreview.com/2024/12/11/1108493/googles-new-project-astra-could-be-generative-ais-killer-app/ * www.reddit.com/r/DailyTechNewsShow/comments/1hby1gv/google_launched_gemini_20_its_new_ai_model_for/ * news.ycombinator.com/item?id=42388783 * wccftech.com/leaked-screenshots-suggest-that-google-might-launch-gemini-2-0-closer-to-openais-upcoming-o1-model-release-window/
Die bereitgestellten Informationen und Analysen sind keine Kauf- oder Verkaufsempfehlung, mehr dazu unter unserem Disclaimer.
Im Fokus
Erste Krypto-Kreditkarte für Japan von Slash Labs angekündigt
Slash Labs wird 2025 die erste Krypto-Kreditkarte Japans, die "Slash Card", einführen, die den japanischen Krypto- und Zahlungsregularien entspricht. Diese Karte soll eine Verbindung zwischen der traditionellen Fiat-Währung und der Krypto-Ökonomie schaffen und sowohl Verbrauchern als auch Händlern in Japan komfortable Zahlungsmöglichkeiten bieten. Mit der Einführung der Slash Card wird ein wichtiger Schritt zur Akzeptanz von Kryptowährungen in Japan erwartet.
11/12/2024
Technologie
Uniswap und die Zukunft der Layer-2-Technologien
Uniswap hat sich als wichtige dezentrale Börse etabliert und spielt eine entscheidende Rolle für das Wachstum von Layer-2 Blockchain-Lösungen, die Transaktionen effizienter und kostengünstiger gestalten. Die zunehmende Integration von L2-Netzwerken wie Arbitrum und Polygon hat zu einem signifikanten Anstieg der Handelsvolumina geführt, mit einem Rekordvolumen von 279,36 Milliarden US-Dollar im Jahr 2024. Trotz Herausforderungen wie Liquiditätsfragmentierung und Interoperabilität zeigt die Zukunft von Uniswap eine vielversprechende Expansion in neue L2-Technologien.
11/12/2024
Technologie
Weitere Posts zum Thema