Mira Murati, Chief Technology Officer på OpenAI, presenterade företagets senaste produktuppgraderingar på scen och i en livesändning i måndags.
ChatGPT står inför en betydande uppgradering. OpenAI tillkännagav i måndags sin senaste artificiella intelligens-modell som kommer att göra ChatGPT smartare och lättare att använda.
Den nya modellen, kallad GPT-4o, är en uppdatering från företagets tidigare GPT-4 modell som lanserades för drygt ett år sedan. Modellen kommer att vara tillgänglig för obetalda kunder, vilket innebär att vem som helst kommer att ha tillgång till OpenAIs mest avancerade teknik genom ChatGPT.
Baserat på företagets demonstration i måndags kommer GPT-4o effektivt att omvandla ChatGPT till en digital personlig assistent som kan delta i realtids, talade konversationer. Den kommer även att kunna interagera med text och “vision,” vilket innebär att den kan se skärmdumpar, foton, dokument eller diagram som användare laddar upp och diskutera dem.
OpenAIChief Technology Officer, Mira Murati, sa att den uppdaterade versionen av ChatGPT nu också kommer att ha minneskapacitet, vilket innebär att den kan lära sig från tidigare konversationer med användare och kan göra realtidsöversättningar.
“Detta är första gången vi verkligen tar ett stort steg framåt när det gäller användarvänlighet,” sa Murati under live-demonstrationen från företagets huvudkontor i San Francisco. “Denna interaktion blir mycket mer naturlig och mycket, mycket enklare.”
Den nya lanseringen kommer när OpenAI försöker hålla sig före den växande konkurrensen i AI-kapplöpningen. Rivaler som Google och Meta arbetar för att bygga allt kraftfullare stora språkmodeller som driver chatbots och kan användas för att föra AI-teknik till olika andra produkter.
OpenAIevenemang kom en dag före Googles årliga I/O-utvecklarkonferens, där uppdateringar av deras Gemini AI-modell förväntas tillkännages. Liksom den nya GPT-4o är Googles Gemini också multimodal, vilket innebär att den kan tolka och generera text, bilder och ljud. OpenAIs uppdatering kommer också före förväntade AI-annonser från Apple vid deras Worldwide Developers Conference nästa månad, vilket kan inkludera nya sätt att integrera AI i nästa iPhone eller iOS-utgåvor.
Samtidigt kan den senaste GPT-lanseringen vara en fördel för Microsoft, som har investerat miljarder dollar i OpenAI för att integrera dess AI-teknik i sina egna produkter.
Demonstration av GPT-4o
OpenAIchefer visade en talad konversation med ChatGPT för att få realtidsinstruktioner för att lösa ett matematiskt problem, berätta en godnattsaga och få kodningsråd. ChatGPT kunde tala med en naturlig, mänsklig röst samt en robotröst — och sjöng till och med en del av ett svar. Verktyget kunde också titta på en bild av ett diagram och diskutera det.
De visade även hur modellen kan detektera användares känslor; i ett exempel lyssnade den på en chefens andning och uppmuntrade honom att lugna ner sig. “Du är ingen dammsugare!” skämtade den kvinnliga rösten i ChatGPT (som påminner om den Scarlett Johansson-röstade digitala följeslagaren från filmen “Her” från 2013).
ChatGPT kunde också ha en konversation på flera språk genom att automatiskt översätta och svara. Verktyget stöder nu mer än 50 språk, enligt OpenAI.
“Det nya röst- (och video-) läget är det bästa datorgränssnitt jag någonsin använt,” sa OpenAIVD Sam Altman i ett blogginlägg efter tillkännagivandet. “Det känns som AI från filmerna; och det är fortfarande lite överraskande för mig att det är verkligt. Att nå mänsklig nivå på svarstider och uttrycksfullhet visar sig vara en stor förändring.”
Murati meddelade att OpenAI kommer att lansera en ChatGPT-skrivbordsapp med GPT-4o-kapaciteter, vilket ger användare ytterligare en plattform att interagera med företagets teknik. GPT-4o kommer också att vara tillgänglig för utvecklare som vill bygga sina egna anpassade chatbots från OpenAIGPT-butik, en funktion som nu också kommer att vara tillgänglig för icke-betalande användare.
De uppdaterade teknikerna och funktionerna kommer att rullas ut till ChatGPT under de kommande månaderna. Gratis ChatGPT-användare kommer att ha ett begränsat antal interaktioner med den nya GPT-4o-modellen innan verktyget automatiskt återgår till att använda den gamla GPT-3.5 modellen; betalande användare kommer att ha tillgång till ett större antal meddelanden med den senaste modellen.
OpenAI sa att mer än 100 miljoner människor redan använder ChatGPT. Men en uppdaterad ChatGPT-upplevelse — och möjligheten att interagera med den på skrivbordet och genom förbättrade röstkonversationer — kan ge ännu fler människor anledning att använda dess teknik. Detta sker samtidigt som AI-integreringar i mer använda konsumentprodukter från Google och Meta, som Instagram och Google Assistant, kan göra dessa företags teknik mer tillgänglig och användarvänlig.