Teknik

OpenAI knäckte ett 80 år gammalt matteproblem utan specialiserad modell

Susan Hill

OpenAI:s allmänna resonemangsmodell har just spräckt en 80 år gammal förmodan i diskret geometri. Modellen är inte tränad för matematik. Den kör samma arkitektur som skriver e-post och Python-kod, och i tisdags producerade den en ny familj av geometriska konfigurationer som fyra matematiker nu har verifierat.

Problemet har en bedrägligt enkel formulering. Ta n punkter i ett plan. Hur många par kan ligga på exakt samma avstånd från varandra, säg en enhet? Paul Erdős ställde frågan 1946 och föreslog en övre gräns: ungefär n upphöjt till (1 plus o(1)), kortform för ”knappt mer än linjärt”. I årtionden kom de bästa kända konfigurationerna från varianter av det kvadratiska rutnätet, och rutnätet låg mycket nära det taket. Matematiker behandlade gränsen som i praktiken skarp.

OpenAI:s modell skärpte inte gränsen. Den bröt den. Systemet producerade en hel familj punktarrangemang med åtminstone n upphöjt till (1 plus δ) par på enhetsavstånd, för ett fixerat δ större än noll. Det är ingen finslipning; det är ett motexempel mot förmodans centrala påstående. Will Sawin, en av de fyra matematiker som granskade arbetet, slipade den nya exponenten till ett rent uttryck. Thomas Bloom, Melanie Wood och Noga Alon, resten av granskningslaget, bekräftade att konstruktionen håller.

Det intressanta med metoden är att den inte kom inifrån geometrin. Modellen tog steget in i algebraisk talteori, utvidgade de Gauss-heltal vi känner till andra algebraiska talkroppar och behandlade gitterpunkterna som kandidatkonfigurationer. Den bron, geometrin dragen in i talteorin, var spranget som människor missade i åtta årtionden. Det är den sortens drag som på ett matematikseminarium får en långsam nick och en lång tystnad.

Reaktionerna från arbetande matematiker kom inom första dygnet. Timothy Gowers, Fieldsmedaljör, kallade det ”det första riktigt tydliga exemplet på att AI löser ett riktigt välkänt matematiskt problem”. Alexander Wei, forskare på OpenAI, skrev att resultatet är av det slag som en referent i Annals of Mathematics skulle acceptera ”utan minsta tvekan”. Det sista påståendet går att testa. Beviset har publicerats som PDF, tillsammans med ett kompletterande anmärkningsdokument, och den bredare matematikgemenskapen läser nu.

Den ram OpenAI lutar sig mot är att det här är första gången ett AI-system självständigt löser ett framträdande öppet problem som ligger centralt i en gren av matematiken. Ordet ”självständigt” gör mycket arbete där. Modellen producerade konstruktionen; beviset granskades, slipades och stresstestades av fyra människor innan något offentliggörande gick ut. Distinktionen spelar roll, för OpenAI har varit här förut.

I oktober 2025 lät företaget cirkulera påståendet att en annan intern modell löst tio öppna problem från Erdős. Inom dagar visade matematiker att flera av dessa ”lösningar” antingen redan var kända eller helt enkelt fel. OpenAI drog tillbaka det övergripande påståendet. Den episoden är skälet till att veckans tillkännagivande inleds med namnen på granskarna snarare än modellens namn. De fyra matematikerna är garantin.

Den andra detaljen värd att hålla i är vilken sorts modell som producerade resultatet. OpenAI har inte avslöjat systemets namn, bara att det är en allmän resonemangsmodell, samma familj som driver chatt, skriver kod och svarar på supportärenden. Det finns ingen matematik-specialiserad variant i loopen. Samma arkitektur som hanterar vardagliga samtal hanterade detta. Implikationen är att flaskhalsen för AI-driven matematik kanske inte var en mattefinslipad modell. Det kan ha varit beräkningstid och tålamod.

Att den flaskhalsen brister är den egentliga storyn. Länge har antagandet bland forskare varit att verkligt originell matematik kräver specialbyggda system: teorembevisare, ramverk för formell verifiering, smala modeller tränade på korpusar av bevis. Det som landade i tisdags är ett annat slags bevis. En resonemangsmodell pekades mot ett berömt, olöst, åttioårigt problem; med tillräckligt med utrymme att tänka producerade den något som Sawin, Bloom, Wood och Alon var överens om var korrekt. Vägen från chattfönstret till Erdős visade sig kortare än väntat.

Några förbehåll gäller fortfarande. Modellen är inte offentligt tillgänglig. Oberoende grupper utanför den ursprungliga panelen av fyra kommer att läsa beviset under de kommande veckorna, och den fulla peer review-processen för Annals eller en annan toppskriftserie tar månader. Exponenten δ är liten. Konstruktionen löser inte det besläktade enhetsavståndsproblemet på sfären eller i högre dimensioner. Inget av detta minskar vad som hände i tisdags. Det placerar det.

Det som ändras är förväntan. För ett år sedan löd frågan om AI i matematiken om dessa system någonsin skulle kunna producera originella bevis av tyngd. Från och med denna vecka är frågan vilket öppet problem som faller härnäst, och om matematikerna som verifierar bevisen kommer att fortsätta krediteras så som Alon och hans kollegor gjordes här.

En förmodan från 1946 är ett av de där tysta föremålen som väntar på en hylla tills rätt hand sträcker sig efter dem. Handen som sträckte sig efter den här i veckan kördes på ett GPU-kluster, hade inte tränats för uppgiften, och avslutade arbetet medan fyra matematiker såg på.

Diskussion

Det finns 0 kommentarer.