Microsoft har presenterat sitt senaste tillskott i Phi-serien av generativa AI-modeller:
Phi-4. Modellen, som är utvecklad för forskningsändamål, erbjuder förbättrad prestanda jämfört med sina föregångare, särskilt när det gäller att lösa matematiska problem.
En avancerad, kompakt AI-modell
Phi-4 är en mindre språkmodell med 14 miljarder parametrar, vilket gör den till en direkt konkurrent till andra små modeller som GPT-4o mini, Gemini 2.0 Flash och Claude 3.5 Haiku. Mindre modeller är ofta snabbare och billigare att köra, och deras prestanda har förbättrats avsevärt under de senaste åren.
Enligt Microsoft beror Phi-4:s framsteg på användningen av “högkvalitativa syntetiska dataset” i kombination med innehåll genererat av människor samt vissa post-träningstekniker. Dessa innovationer har blivit alltmer centrala i AI-utvecklingen. Scale AI:s VD Alexandr Wang kommenterade nyligen att “vi har nått en pre-träningsdata-vägg,” vilket understryker behovet av nya lösningar som syntetisk data.
Begränsad åtkomst för forskare
Phi-4 finns för närvarande endast tillgänglig via Microsofts nyligen lanserade Azure AI Foundry, en plattform för AI-utveckling. Modellen erbjuds enbart för forskning och kräver ett forskningslicensavtal med Microsoft.
En ny era för Phi-serien
Lanseringen av Phi-4 markerar en viktig milstolpe för Microsofts Phi-serie och är den första modellen i serien som släpps efter att Sébastien Bubeck, en av företagets ledande AI-experter, lämnade Microsoft i oktober för att gå till OpenAI. Bubeck var en central figur i utvecklingen av Phi-modeller och hans avhopp väckte stor uppmärksamhet i branschen.
Microsofts fokus på generativ AI
Phi-4 visar Microsofts fortsatta satsning på generativ AI och mindre, effektiva modeller som kan användas i forsknings- och utvecklingssammanhang. Genom att kombinera avancerad teknik med högkvalitativ data siktar företaget på att driva framstegen inom AI ytterligare.
Med Phi-4:s lansering tar Microsoft ytterligare ett steg framåt i konkurrensen om att leda utvecklingen av nästa generations AI-modeller.