Teknik

LongCat 2.0 slår GPT-5.5 i kodning — tränad på kinesiska chip utan Nvidia

Susan Hill

LongCat 2.0 har 1,6 biljoner parametrar, hanterar ett kontextfönster på en miljon tokens och har precis passerat GPT-5.5 på det ledande riktmärket för mjukvaruutveckling i verkligheten. Det byggdes av Meituan — ett företag som de flesta utanför Kina känner till, i bästa fall, som en matleveransapp.

Modellen fick 59,5 på SWE-bench Pro mot GPT-5.5:s 58,6. Marginalen ser liten ut. Det som gör prestationen anmärkningsvärd är hur systemet byggdes: Meituan tränade LongCat 2.0 på över 50 000 inhemska kinesiska AI-acceleratorer, utan Nvidia-hårdvara som Kina inte kan importera i stora volymer sedan 2022. Tillverkaren av chipsen har inte bekräftats officiellt, men branschen pekar mot Huawei Ascend 910B. Om det stämmer vore det första gången en modell tränad på Huawei-chips når toppnivå i öppna, verifierbara riktmärken.

LongCat 2.0 använder Mixture-of-Experts-arkitektur: bara 33 till 56 miljarder parametrar aktiveras per förfrågan, vilket håller inferensen snabb utan krav på dyrt hårdvara. Kontextfönstret på en miljon tokens gör det möjligt att läsa en hel kodbas i en session. På SWE-bench Multilingual fick modellen 77,3; på Terminal-Bench, som testar navigering i en riktig Unix-miljö, nådde den 70,8.

Innan det officiella tillkännagivandet körde modellen diskret på OpenRouter under namnet ”Owl Alpha” i ungefär två månader. Utvecklare som använde den noterade dess ovanliga kodningsförmåga utan att veta varifrån den kom. Meituan bekräftade efter lanseringen att Owl Alpha var LongCat 2.0 i en tidig utvärderingsfas.

MIT-licensen berättar bara en del av historien. Trots att den är en av de mest öppna och kommersiellt tillåtna licenserna har modellvikterna inte publicerats än. Både GitHub-repositoriet och Hugging Face-kortet säger ”kommer snart”. Just nu är LongCat 2.0 tillgänglig enbart via ett hostat API — nedladdning, finjustering och lokal körning är inte möjliga ännu.

Meituan hanterar dagligen över 50 miljoner matbeställningar och hade redan tyst byggt en intern språkmodell kallad Zhichi. LongCat 2.0 är dess första publika modell och, baserat på benchmarkresultaten, ett av de mest kapabla kodningssystemen tillgängliga under öppen licens.

När vikterna väl släpps tävlar LongCat 2.0 direkt med Metas Llama 4.1 och DeepSeek-V4 Pro. Svaret på frågan om vilka inhemska chips som möjliggjorde dessa resultat kommer att ha konsekvenser långt utanför AI-världen.

Taggar: , , , , ,

Diskussion

Det finns 0 kommentarer.