Den relativt okända kinesiska startupen DeepSeek har chockat den globala techsektorn med lanseringen av sin AI-modell, DeepSeek-R1. Modellen påstås ha kapabiliteter som kan mäta sig med Googles och OpenAI:s toppmodeller, vilket har skapat stor uppmärksamhet i branschen.
Det som gör DeepSeek-R1 särskilt anmärkningsvärd är att den utvecklats med färre och mindre avancerade datorchip än de som används av amerikanska techjättar. Företagets grundare, Liang, har därmed visat att innovation inte nödvändigtvis kräver samma enorma resurser som de största aktörerna har tillgång till.
“Det är inte för sent för startups att satsa på AI”
I en intervju med kinesiska Waves 2023 avfärdade Liang idén att det skulle vara för sent eller för dyrt för startups att ge sig in i AI-utveckling.
“Reproduktion är relativt billig — baserat på offentliga forskningsartiklar och öppen källkod räcker minimal träning eller till och med finjustering. Forskning, däremot, kräver omfattande experiment, jämförelser och högre krav på beräkningskapacitet,” förklarade han.
Liang avslöjade att hans intresse för AI främst drivs av nyfikenhet. “Ur ett bredare perspektiv vill vi testa vissa hypoteser. Till exempel antar vi att essensen av mänsklig intelligens kan vara språket, och att mänskligt tänkande i grunden är en språklig process,” sa han enligt en transkribering av intervjun.
En utmanare att räkna med
DeepSeek-R1 markerar ett betydande steg för mindre aktörer inom AI-industrin, som annars domineras av techjättar som Google, Microsoft och OpenAI. Modellen illustrerar också hur mindre resurser kan kompenseras av strategisk användning av befintlig forskning och öppen källkod.
Det återstår att se hur DeepSeek kommer att påverka den globala AI-marknaden, men lanseringen av DeepSeek-R1 har utan tvekan satt startupen på kartan som en allvarlig utmanare.