OpenAI utökar tillgängligheten av sitt avancerade röstläge för ChatGPT till webbläsare, vilket gör det möjligt för användare att prata med AI-chatboten direkt från sin webbläsare. Den nya funktionen presenterades av företagets produktchef Kevin Weil på plattformen X.
Röstläget, som gör ChatGPT mer naturlig att interagera med, är tillgängligt för betalande användare från och med denna vecka. Det innebär att Plus-, Enterprise-, Teams- och Edu-prenumeranter kan använda funktionen. Lanseringen på webben följer efter introduktionen av röstläget i ChatGPT:s iOS- och Android-appar i september.
Den avancerade röstfunktionen använder OpenAI:s GPT-4o och dess inbyggda ljudfunktioner för att möjliggöra naturliga och realtidskonversationer mellan användare och ChatGPT. Chatboten kan förstå och svara på icke-verbala signaler, som talhastighet, och kan även svara med känslor.
För att börja en röstkonversation på webben klickar användaren på röstikonen längst ner till höger i ChatGPT:s fönster och ger webbläsaren tillstånd att använda datorns mikrofon. När röstläget startar visas en blå orb på skärmen som indikerar att konversationen är aktiv.
Användare kan välja mellan nio olika röster för ChatGPT, där varje röst har sin unika ton och karaktär. Exempelvis kan man välja “Arbor,” som beskrivs som “avslappnad och mångsidig,” eller “Ember,” som är “självsäker och optimistisk.”
Weil meddelar att OpenAI planerar att lansera funktionen för gratisanvändare inom de kommande veckorna. Betalande användare med Plus- och Teams-prenumerationer har dock en daglig gräns för hur länge de kan använda röstläget. OpenAI kommer att meddela användaren när det återstår 15 minuter av den dagliga användningen. Gratisanvändare kommer att få tillgång till en månadsvis förhandsvisning för att testa funktionen.
Med denna lansering tar OpenAI ytterligare ett steg för att göra AI-konversationer mer tillgängligt och engagerande för användarna.