Teknik

DeepSeek gjorde AI billigt medan USA prissatte motsatsen

Susan Hill

DeepSeek, ett kinesiskt labb som vuxit fram ur en kvantitativ hedgefond, fortsätter göra det som den amerikanska AI-industrin prissatte som omöjligt. Det bygger modeller som presterar nära fronten, tränar dem för en bråkdel av vad de amerikanska rivalerna lägger ut och publicerar sedan vikterna så att vem som helst kan ladda ner och köra dem. Varje släpp öppnar samma diskussion: värderingen av hela den amerikanska AI-sektorn vilar på ett antagande som DeepSeek tyst monterar ner, nämligen att intelligens måste förbli dyr.

Det antagandet är inte abstrakt. Det bär upp hundratals miljarder dollar i datacenter under byggnation, aktiekurserna hos chiptillverkarna och molnleverantörerna som finns i nästan varje indexfond, och den månadsavgift många läsare redan betalar för en chatbot. Om en rival levererar jämförbara resultat för långt mindre och ger bort mjukvaran börjar premien för knapp, dyr beräkningskraft likna mindre en vallgrav och mer ett vad.

DeepSeeks påstående handlar om effektivitet, inte trolleri. Ingenjörerna satsade på en mixture-of-experts-design som bara väcker en del av modellen vid varje fråga, på aggressiv användning av beräkningar med lägre precision och på träningskedjor trimmade för att gå på färre och delvis exportbegränsade chip. Den oftast upprepade siffran för en av huvudträningarna låg under sex miljoner dollar. Jämförbara amerikanska körningar antas kosta många gånger mer när hela notan räknas ihop.

Hur modellen släpps betyder lika mycket som vad den kostade. DeepSeek lägger ut öppna vikter, så en utvecklare i São Paulo, ett universitetslabb i Warszawa eller en startup i Seoul kan hämta modellen och köra den på egna maskiner, utan att betala en amerikansk leverantör per fråga och utan att skicka sina data utomlands. Här finns en ironi: exportkontrollerna som skulle bromsa kinesisk AI genom att strypa de kraftfullaste chippen tycks ha tvingat DeepSeek att pressa mer ur mindre, och de snåla metoderna reser nu överallt dit de öppna vikterna når.

För den som bara använder verktygen är den omedelbara effekten valfrihet. Billigare modeller pressar ner abonnemangspriserna, för in mer kapabla assistenter på vanliga laptops och telefoner och försvagar skälet att låsa in sig hos en enda leverantör. Det som kändes som en tjänst man hyr börjar likna mjukvara man kan äga.

Pratet om bubblan kräver stora förbehåll. Siffran under sex miljoner dollar täcker en enda slutlig träningskörning, inte forskningen, återvändsgränderna, lönerna eller hårdvaran som gjorde den möjlig, så att ställa den mot ett amerikanskt labbs totala utgifter är att jämföra två olika saker. Öppna vikter är inte heller öppen källkod; träningsdatan och hela metoden förblir privata. Och effektivitetsargumentet skär åt båda håll. Tillfrågad om DeepSeek grep Microsofts ledning efter Jevons paradox, den gamla iakttagelsen att när en resurs blir billigare att använda tenderar den totala förbrukningen att stiga snarare än sjunka. Billigare intelligens kan helt enkelt betyda att världen köper långt mer av den, en god nyhet för dem som säljer beräkningskraft, inte en dålig.

Det är inte heller första gången bubblan dödförklaras. Samma labb utlöste en gång den största börsvärdeförlusten på en enda dag i USA:s historia, raderade nära sexhundra miljarder dollar hos en chiptillverkare på en eftermiddag och såg sedan aktien ta igen nästan allt inom veckor. De stora amerikanska AI-bolagen svarade inte med att spendera mindre. De reste mer kapital och byggde större. Varje påstående om att bubblan äntligen spruckit måste överleva det faktum att just de med mest pengar på bordet dubblar sin insats.

Det DeepSeek faktiskt har gjort är svårare att dramatisera än en sprucken bubbla. Det har tagit bort bekvämligheten i att anta att de ledande amerikanska labben skyddas av en kapitalmur som ingen annan kan klättra över. Om spjutspetsförmåga kan approximeras billigt och delas ut gratis slutar värdet att ligga i att äga modellen. Det flyttar till distributionen, till produkterna byggda kring modellen och till den som håller kunden. Nästa prov står redan i kalendern, även utan ett datum: varje nytt DeepSeek-släpp öppnar samma fråga och landar på en marknad som förbundit sig att spendera mer, inte mindre, i tron att skala fortfarande vinner. Det avgörs i kvartalsrapporterna och investeringsprognoserna de kommande månaderna, inte i en forumtråd som redan utropat striden som avgjord.

Diskussion

Det finns 0 kommentarer.