18.2.2025
Technologie

Grok-3: Neues KI-Modell von xAI beeindruckt mit Leistung und Hardware

xAI, Elon Musks KI-Unternehmen, hat sein neues Sprachmodell Grok-3 vorgestellt, das durch beeindruckende Benchmark-Ergebnisse, insbesondere in Mathematik und Programmierung, glänzt. Trotz der enormen Rechenleistung und vielversprechenden Testergebnisse wirken die demonstrierten Funktionen jedoch wenig innovativ und ähneln bereits existierenden KI-Modellen. xAI plant, Grok-3 für X Premium Plus-Abonnenten und über eine eigene Plattform zugänglich zu machen.

Grok-3: Musks xAI präsentiert neues KI-Modell – Leistung beeindruckt, Innovation fraglich

Elon Musks KI-Unternehmen xAI hat am Montag sein neues Sprachmodell Grok-3 vorgestellt. Wie Cryptonews.net berichtet, begleiteten die Präsentation hohe Erwartungen an die Fähigkeiten des Modells und die Enthüllung einer massiven Recheninfrastruktur, die auf noch größere Zukunftspläne hindeutet. Der Fokus lag dabei deutlich auf Rechenleistung, Benchmark-Ergebnissen und angekündigten Funktionen. Viele der gezeigten Anwendungsbeispiele wirkten jedoch wie eine Nachbildung bereits existierender Leistungen anderer KI-Unternehmen. Im ersten Teil der Präsentation stand nicht die KI selbst, sondern die zugrundeliegende Hardware im Vordergrund: "Colossus", ein riesiger Cluster aus 200.000 GPUs, der das Training von Grok-3 ermöglicht. Der Aufbau erfolgte in zwei Phasen: 122 Tage synchrones Training auf 100.000 GPUs, gefolgt von 92 Tagen Skalierung auf die vollen 200.000. Laut xAI-Entwicklern stellte die Konstruktion dieser Infrastruktur eine größere Herausforderung dar als die Entwicklung des KI-Modells selbst. Das Unternehmen plant bereits einen noch leistungsfähigeren Cluster. Musk strebt eine Verfünffachung der Kapazität an und würde damit den weltweit stärksten GPU-Cluster erschaffen. Berichten von OpenTools zufolge erzielt Grok-3 in gängigen KI-Benchmarks beeindruckende Ergebnisse. Das Basismodell führt die Ranglisten in Mathematik (AIME), Naturwissenschaften (GPOA) und Programmiertests (LCB) an. Auch in Blindtests zeigt es vielversprechende Leistungen. xAI bestätigte, dass das zuvor unter dem Codenamen "Chocolate" bekannte Modell eine frühe Testversion von Grok-3 war, die auf der LLM Arena hochgeladen wurde. Dort erreichte es den höchsten ELO-Wert unter allen LLMs. Das bedeutet, dass Nutzer in direkten Vergleichen die Antworten von Grok-3 gegenüber anderen KI-Modellen bevorzugten, ohne zu wissen, welches Modell sie gerade bewerteten. Laut xAI ist dies die präziseste Methode zur Qualitätsmessung, da die Modelle die Benchmarks nicht durch Training mit den Datensätzen manipulieren können. Dieser Benchmark basiert ausschließlich auf den Präferenzen und der Blindwahl tausender anonymer Nutzer. Eine spezialisierte "Reasoning Beta"-Variante von Grok-3, die interne Denkprozesse (Chain-of-Thought) und zusätzliche Rechenleistung während des Tests nutzt, verbessert die Mathematikergebnisse nochmals – sie erreicht 93% im AIME 2025-Benchmark, während die nächstbesten Modelle unter 87% liegen. Interessanterweise übertrifft eine kleinere Version namens Grok-3 Mini Reasoning Beta aufgrund einer längeren Trainingszeit gelegentlich die größere Variante. Das deutet darauf hin, dass das vollständige Grok-3 nach einer vergleichbar langen Trainingszeit noch deutlich leistungsfähiger werden könnte, was angesichts der höheren Parameterzahl vielversprechend ist. Die Live-Demonstration der Grok-3-Fähigkeiten wirkte jedoch eher wie ein Aufholen des Rückstands als wie Innovation. Das Team zeigte, wie das Modell Physikaufgaben löst und Spielecode von Grund auf neu schreibt – beeindruckende Leistungen, die laut TechCrunch von ChatGPT, Claude und Googles Gemini bereits demonstriert wurden. Vorgestellt wurde auch DeepSearch, ein Recherche-Agent, der ähnlich wie Tools von OpenAI und Google das Web durchsucht und umfangreiche Berichte zu bestimmten Themen erstellt. X Premium Plus-Abonnenten erhalten laut TechCrunch sofortigen Zugriff auf Grok-3, die leistungsstärkste und aktuellste Version wird jedoch voraussichtlich über eine eigene App oder auf Grok.com verfügbar sein. Sprachinteraktionen, ähnlich dem "Advanced Voice Mode" von OpenAI, sollen in den kommenden Wochen eingeführt werden. Musk betonte, dass es sich dabei nicht um einfaches Text-to-Speech, sondern um ein echtes KI-Sprachmodell handelt, das natürliche und ausdrucksstarke Sprache generieren kann. Entwickler erhalten in den kommenden Wochen API-Zugriff sowie Audiotranskriptionsfunktionen, was Grok-3 zu einem mächtigen Werkzeug für KI-gestützte Drittanbieter-Apps macht. Quellen: - Cryptonews.net: https://cryptonews.net/news/other/30540528/ - decrypt.co - OpenTools.ai - TechCrunch - Ground News - Bloomberg - Economic Times - Times of India
Die bereitgestellten Informationen und Analysen sind keine Kauf- oder Verkaufsempfehlung, mehr dazu unter unserem Disclaimer. Dieser Artikel wurde mithilfe von künstlicher Intelligenz erstellt.
Im Fokus
Kapitalflüsse im Wandel: Die Dynamik des Blockchain-Gaming-Marktes
Der Blockchain-Gaming-Markt durchläuft derzeit eine Phase intensiver Kapitalumschichtung, die als "Stuhlrücken" beschrieben wird. Ein Mangel an frischem Kapital und die Veröffentlichung neuer Spiele führen dazu, dass Investoren ihr Kapital möglicherweise von etablierten Projekten abziehen und in vielversprechendere Technologien investieren. Unternehmen in dieser Branche müssen sich anpassen und innovative Lösungen finden, um in einem dynamischen und wettbewerbsintensiven Umfeld erfolgreich zu bleiben.
22/2/2025
Technologie
Partnerschaft für Blockchain-Dateninnovation über 55 Chains
Multiple Network und Unmarshal AI haben eine Partnerschaft geschlossen, um die Zugänglichkeit von Blockchain-Daten zu verbessern und den Datenschutz für KI-Anwendungen im Web3 zu erhöhen. Die Zusammenarbeit ermöglicht den Zugriff auf Echtzeit-Multi-Chain-Daten aus über 55 Blockchains und verbessert die Datenschutzstandards sowie die Effizienz von KI-gesteuerten Anwendungen. Diese strategische Allianz fördert die Entwicklung dezentraler Finanzstandards und innovativer Lösungen im Bereich Datenschutz und KI.
22/2/2025
Technologie
Weitere Posts zum Thema