Microsoft hat sein neues generatives KI-Modell Phi-4 vorgestellt, das trotz geringerer Größe als vergleichbare Modelle, insbesondere bei mathematischen Aufgaben, überzeugende Leistungen erzielt. Der Fokus liegt auf Effizienz und Kosteneinsparung, ermöglicht durch verbesserte Trainingsdaten und Optimierung nach dem Training, wodurch Phi-4 auch für kleinere Unternehmen attraktiv wird. Derzeit ist das Modell über Azure AI Foundry für Forschungszwecke verfügbar.
Microsoft hat Phi-4, das neueste Modell seiner generativen KI-Reihe Phi, vorgestellt. Wie Microsoft selbst berichtet, übertrifft Phi-4 seine Vorgänger in verschiedenen Bereichen, insbesondere beim Lösen mathematischer Aufgaben. Dies wird unter anderem durch verbesserte Trainingsdaten erreicht. Laut TechCrunch ist Phi-4 seit Donnerstagabend in begrenztem Umfang über Microsofts neue Entwicklungsplattform Azure AI Foundry verfügbar, jedoch ausschließlich für Forschungszwecke im Rahmen einer Microsoft-Forschungslizenzvereinbarung. CryptoPolitan beschreibt Phi-4 als Microsofts neuestes kleines Sprachmodell mit 14 Milliarden Parametern, das mit anderen kleinen Modellen wie GPT-4o mini, Gemini 2.0 Flash und Claude 3.5 Haiku konkurrieren soll. Kleinere KI-Modelle sind oft schneller und kostengünstiger zu betreiben, und ihre Leistung hat in den letzten Jahren deutlich zugenommen.
TechCrunch führt die Leistungssteigerung von Phi-4 auf die Verwendung von "hochwertigen synthetischen Datensätzen" in Kombination mit hochwertigen, von Menschen erstellten Datensätzen sowie auf nicht näher spezifizierte Verbesserungen nach dem Training zurück. Innovationen im Bereich synthetischer Daten und Post-Training-Optimierung sind derzeit wichtige Forschungsschwerpunkte vieler KI-Labore. Der CEO von Scale AI, Alexandr Wang, bestätigte in einem Tweet am Donnerstag die jüngsten Berichte, wonach die Grenzen der verfügbaren Pre-Training-Daten erreicht seien.
TechCrunch hebt hervor, dass Phi-4 das erste Modell der Phi-Serie ist, das nach dem Wechsel von Sébastien Bubeck, ehemals Vizepräsident für KI bei Microsoft und Schlüsselfigur in der Phi-Modellentwicklung, zu OpenAI im Oktober veröffentlicht wurde.
Wie im Microsoft AI Platform Blog beschrieben, zeichnet sich Phi-4 besonders durch seine Fähigkeiten im komplexen Denken, insbesondere im mathematischen Bereich, aus. Laut Microsoft übertrifft Phi-4 vergleichbare und größere Modelle beim mathematischen Schlussfolgern. Diese Leistungssteigerung wird auf Fortschritte im gesamten Entwicklungsprozess zurückgeführt, darunter die Nutzung hochwertiger synthetischer Datensätze, die Auswahl hochwertiger organischer Daten und Innovationen im Post-Training. Der Blog-Beitrag präsentiert Benchmarks, die zeigen, wie Phi-4 deutlich größere Modelle, einschließlich Gemini Pro 1.5, bei mathematischen Wettbewerbsaufgaben übertrifft.
VentureBeat unterstreicht die Bedeutung von Phi-4 für Unternehmen. Die Effizienz des Modells könnte die Betriebskosten erheblich senken und anspruchsvolle KI-Funktionen auch für mittelständische Unternehmen und Organisationen mit begrenztem IT-Budget zugänglich machen. VentureBeat betont auch die Stärke von Phi-4 im mathematischen Problemlösen, was auf potenzielle Anwendungen in der wissenschaftlichen Forschung, im Ingenieurwesen und in der Finanzmodellierung hindeutet.
Visual Studio Magazine berichtet über die Integration von KI in .NET 9 und hebt die neuen Abstraktionen hervor, die die Interaktion mit KI-Diensten, einschließlich kleiner und großer Sprachmodelle, vereinfachen. Die Partnerschaften von .NET 9 mit verschiedenen KI-Partnern, darunter Azure und OpenAI, werden ebenfalls erwähnt.
Maginative beschreibt Phi-4 als einen Durchbruch, der von der traditionellen "Größe-zuerst"-Mentalität in der KI abweicht. Anstatt sich auf die Größe des Modells zu konzentrieren, hat Microsoft seine Daten- und Trainingsprozesse verfeinert, um die Leistung pro Parameter zu maximieren. Der Artikel weist jedoch auch auf die von Microsoft eingeräumten Schwächen des Modells hin, wie z. B. faktische Halluzinationen und Schwierigkeiten bei der strikten Befolgung von Anweisungen.