Teknik

Claude Fable 5 hittade ett 27 år gammalt fel i OpenBSD

Susan Hill

I 27 år låg en enda brist orörd inne i OpenBSD, ett av de operativsystem som banker, brandväggar och servrarna bakom vardagliga webbplatser litar på. Den som kunde nå maskinen över ett nätverk kunde få den att krascha, och i nästan tre decennier märkte ingen det. En Anthropic-modell vid namn Mythos gjorde det. Nu har den modellen ett offentligt ansikte: Anthropic har släppt Claude Fable 5, den första versionen av sitt mest kapabla system som vem som helst kan registrera sig för att använda.

Det som gör Fable 5 värd uppmärksamhet är inte en placering på en lista. Det är att modellen under läser programvara som en erfaren revisor läser ett avtal, tills den hittar den enda klausul som får allt att rämna. Inom ett forskningsprogram som Anthropic kallar Project Glasswing gick förhandsversionen igenom mer än tusen projekt med öppen källkod, den fria och delade kod som driver större delen av internet, och flaggade över 23.000 problem. Mer än 10.000 av dem var allvarliga nog att klassas som höga eller kritiska.

Detaljen som oroade till och med Anthropics egna forskare är att ingen lärde modellen detta. Företaget uppger att förmågan att hitta och utnyttja svagheter aldrig var ett träningsmål: den uppstod av sig själv när modellen blev bättre på att resonera om kod. FFmpeg är det tydligaste exemplet. En brist hade gömt sig i 16 år i den programvaran för videobehandling, motorn bakom otaliga strömningsappar och mediespelare, inbäddad i en rad kod som automatiska testverktyg utlöst fem miljoner gånger utan att någonsin se faran. Modellen såg den.

För de flesta ser ingenting av detta ut som något alls. Programvaran som Mythos granskade är osynlig infrastruktur: webbläsarmotorn, operativsystemets kärna, mediebiblioteket begravt inuti en telefon. Men det osynliga är just problemet. Bristerna som kom fram hade överlevt eftersom de bodde i kod som var för gammal, för tråkig eller för djup för att någon skulle fortsätta läsa om den. Ett verktyg som kan läsa om allt, outtröttligt, ändrar oddsen för dem som underhåller internets grundvalar, och i fel händer för dem som vill angripa dem.

Siffror som dessa betyder något först mot en måttstock. På CyberGym, ett test av om en modell kan återskapa en verklig säkerhetsbrist, når Mythos-motorn i Fable 83,1 procent mot 66,6 procent för tidigare Claude Opus 4.6, ungefär skillnaden mellan en kompetent junioranalytiker och en specialist som sällan missar. Framstegen stannar inte vid säkerhet. Analysföretaget Hex uppgav att Fable var den första modellen att passera 90 procent i deras interna test, och tidiga användare beskriver liknande språng inom mjukvaruutveckling, dataanalys och gränssnittsdesign.

Sedan kommer vändningen. Den publika Fable 5 gör inte just det som gör den anmärkningsvärd. Anthropic har stängt av fyra områden, cybersäkerhet, biologi, kemi och en kopieringsteknik som kallas destillation, och när en förfrågan glider in i dem lämnar Fable tyst över samtalet till den äldre och säkrare Claude Opus 4.8. Det sker sällan, enligt företaget, och tidiga data visar att minst 95 procent av sessionerna körs helt på Fable. Resultatet är en ovanlig produkt: den mest kapabla modell Anthropic levererat, medvetet hindrad från att använda sin vassaste förmåga.

Den konstruktionen lämnar frågor som lanseringen inte helt besvarar. En spärr som kliver åt sidan 5 procent av gångerna är fortfarande en spärr med sömmar, och gränsen mellan att förklara hur en programvara fungerar och att förklara hur man bryter den är sällan ren. Anthropic uppger att ett externt bug bounty-program pågick i mer än 1.000 timmar utan att hitta ett universellt sätt att kringgå begränsningarna, men det är företagets egna siffror, granskade av ingen utomstående tillsyn. Det finns också en kostnad som de flesta märker först: Fable 5 kostar 10 dollar per miljon tokens in och 50 per miljon ut, de ungefärliga enheter en modell tar betalt för att läsa och skriva, dubbelt så mycket som Opus 4.8. Och alla som använder den ger upp något tystare, eftersom Anthropic nu sparar 30 dagars användningsdata även för kunder som annars betalar för ingen lagring alls, och kallar det ett skydd mot missbruk.

Tills vidare beror tillgången på hur du redan använder Claude. Utvecklare når Fable 5 direkt via Anthropics programmeringsgränssnitt, och en separat version vid namn Mythos 5 har gått till en liten grupp förhandsgodkända organisationer, vid sidan av en branschkoalition som omfattar Apple, Google, Microsoft, Nvidia och Linux Foundation, alla upptagna med att täppa till det modellen hittar innan angripare hinner. Anthropic har avsatt 100 miljoner dollar i modellkrediter och 4 miljoner i direkta donationer till de säkerhetsgrupper med öppen källkod som utför reparationsarbetet.

Den bredare utrullningen följer en kalender. Prenumeranter på Anthropics planer Pro, Max, Team och platsbaserad Enterprise får Fable 5 utan extra kostnad till och med 22 juni; från 23 juni tär användningen på krediter. Om spärrarna håller när miljontals nya användare trycker mot dem är den del som ännu är oavgjord. Det mer slående faktumet är det inte. En maskin kan nu läsa koden under det moderna livet och hitta sprickorna som undgick alla under en hel generation, och frågan som följer är inte längre om den kan, utan vem som får be den om det.

Taggar: , ,

Diskussion

Det finns 0 kommentarer.