DeepL, den snabbväxande tyska AI-startupen, har lanserat DeepL Voice – en röstöversättningstjänst som i realtid omvandlar tal från ett språk till text på ett annat. Med denna satsning möter DeepL den växande efterfrågan på AI-drivna tjänster och erbjuder en ny möjlighet att kommunicera smidigt över språkbarriärer i exempelvis möten och videosamtal.
En ny funktion för realtidsöversättning
DeepL, som idag har över 100 000 betalande kunder och är värderat till två miljarder dollar, har sedan tidigare gjort sig känd för sina precisa textöversättningar. Nu breddar företaget sin plattform med DeepL Voice, där användare kan tala in på ett språk och få en direkt översättning som text på ett annat språk. Tjänsten stöder för närvarande 13 språk, inklusive svenska, tyska, engelska, japanska och franska. Översättningarna levereras i textformat, vilket enligt DeepL gör det möjligt att presentera dem utan fördröjning – en fördel i jämförelse med många andra röstöversättningstjänster.
Funktioner för samtal och videokonferenser
I fysiska möten kan användare använda sin smartphone för att visa översättningen som en “spegel” på skärmen mellan deltagarna, eller skicka en transkription att dela. Vid videosamtal fungerar DeepL Voice som undertexter i realtid, vilket gör det lättare för internationella team att samarbeta. Just nu är funktionen tillgänglig för användning i Microsoft Teams, och DeepL undersöker möjligheter att införa stöd för andra plattformar som Zoom och Google Meet i framtiden.
En efterlängtad funktion – byggd för att möta kundernas behov
Sedan DeepLgrundande 2017 har en röstöversättning varit en av de mest efterfrågade funktionerna bland företagets användare, enligt VDJarek Kutylowski. Med en strategi att bygga sina egna språkmodeller från grunden har DeepL tagit en medveten och noggrann väg till denna lansering. I somras släppte företaget en ny språkmodell optimerad för just översättningar, som de hävdar överträffar konkurrerande AI-modeller inklusive GPT-4, Google och Microsofts modeller, särskilt för översättning.
En framåtblick – från text till ljud och video
DeepL Voice levererar för närvarande endast översättningen som text, men företaget har framtidsplaner för att lägga till röst- och videoutgångar för en ännu mer naturlig upplevelse. Kutylowski antyder att DeepL redan nu ser stor potential för sin nya produkt inom servicebranschen – exempelvis för personal i restauranger som kan använda tjänsten för att kommunicera med internationella gäster.
Dataskydd i fokus
Med den växande medvetenheten om integritet och dataskydd har DeepL försäkrat att inga inspelningar lagras eller används för att träna bolagets AI-modeller. Röstinspelningarna skickas till DeepLservrar för att översättas, men hanteras enligt GDPR och andra dataskyddsregler för att skydda användarnas integritet.
DeepL Voice innebär ett steg framåt för AI-drivna röstöversättningar i realtid och för DeepLlångsiktiga vision att göra världen mer sammanlänkad genom språkteknologi.