Jak model pro reasoning prolomil 80 let starý matematický problém

Futuristic illustration of a reasoning model breaking through layers of a discrete geometry problem with glowing points and unit-distance circles.

Ve světě umělé inteligence se občas objeví oznámení, které zní skoro neuvěřitelně. Jedním z nich je případ, kdy obecný reasoning model pomohl vyvrátit dávnou domněnku Paula Erdőse o jednotkových vzdálenostech. Nešlo o školní hádanku ani o soutěžní úlohu z olympiády. Šlo o významný otevřený problém z diskrétní geometrie, který odolával desítky let.

Na celé věci mě zaujalo několik rovin najednou. Zaprvé, model nebyl vytvořen jako úzce specializovaný matematický nástroj. Zadruhé, výsledek nepřišel po letech ručního dolaďování pro jediný benchmark, ale jako důsledek širšího posunu v tom, jak modely přemýšlejí. A zatřetí, reakce výzkumníků byla směsicí nadšení, opatrnosti a postupně rostoucího přesvědčení, že se děje něco opravdu důležitého.

Celý příběh otevírá větší otázku: co se stane, když modely dostanou více času na přemýšlení, lepší nástroje a dost prostoru na zkoušení různých cest? Odpověď zní, že mohou začít řešit problémy, které ještě nedávno vypadaly jako vzdálená budoucnost.

Obsah

🧠 Od matematických olympiád k otevřeným problémům
📐 Co je Erdősova domněnka o jednotkových vzdálenostech
🔬 Jak k objevu vlastně došlo
✅ Ověření důkazu bylo skoro stejně důležité jako jeho nalezení
🛠️ Ne specializovaný matematický stroj, ale obecný model
🎯 Proč více času na přemýšlení mění pravidla hry
🎨 Byla v tom kreativita?
🌐 Jaké nástroje model používal
🤝 Proč by to matematiky nemělo děsit, ale posílit
📈 Jak AI mění práci výzkumníka už dnes
🧪 Praktické rady pro výzkumníky, kteří chtějí AI opravdu používat
🚀 Co to může znamenat pro budoucnost matematiky
🔐 Kryptografie, kvantové počítače a další obory
🌍 Nejde o závod vyřešit všechny Erdősovy problémy
📚 Co si z toho odnáším

🧠 Od matematických olympiád k otevřeným problémům

Alexander Wei, Lijie Chen a Hongxun Wu patří k týmu zaměřenému na reasoning, tedy na schopnost modelů postupovat při řešení úloh krok za krokem. V jejich vyprávění je dobře vidět, jak rychle se obor posunul.

Ještě nedávno byly jako symbolický test pokroku v AI často zmiňovány soutěže jako International Mathematical Olympiad a International Olympiad in Informatics. Tyto olympiády jsou známé tím, že neověřují jen znalosti, ale hlavně hluboké uvažování. Účastníci mají mnoho hodin na několik mimořádně těžkých úloh. Dlouho se braly jako jakási nepsaná velká výzva pro AI: kdy se modely dostanou na úroveň nejlepších lidí?

Právě tento druh problémů lákal výzkumníky k práci na reasoningu. Alexander Wei popisuje, že ho zajímala myšlenka využít více výpočetního času během řešení, ne jen při tréninku. Místo okamžité odpovědi může model zvažovat varianty, zkoušet cesty, opravovat se a dojít dál než při rychlé reakci. Dnes se tomu běžně říká test time compute nebo inference time compute.

Tahle změna je zásadní. Starší modely často odpovídaly okamžitě, skoro jako když člověk střílí od boku. Reasoning model naopak dostane šanci přemýšlet déle. A jakmile má více času, začíná zvládat úlohy, které byly dříve mimo jeho dosah.

Na konci roku 2023 a začátku roku 2024 přitom ani tohle nebylo samozřejmé. Modely měly problémy i s poměrně jednoduchou matematikou. Dnes už se ale mluví o výsledcích, které přesahují olympiádní úroveň a vstupují do prostoru skutečného výzkumu.

📐 Co je Erdősova domněnka o jednotkových vzdálenostech

Aby bylo jasné, proč tento výsledek vzbudil takový rozruch, je dobré si samotný problém stručně vysvětlit.

Představím si rovinu a v ní konečný počet bodů. Ptám se, kolik dvojic těchto bodů může být od sebe vzdáleno přesně o jednu jednotku. Jak tento počet roste, když bodů přibývá? To je jádro slavného problému známého jako unit distance problem.

Paul Erdős vyslovil domněnku, že nejlepší nebo téměř nejlepší uspořádání bodů vypadá jako čtvercová mřížka. Intuitivně to zní rozumně. Mřížka je pravidelná, symetrická a nabízí mnoho stejně dlouhých vzdáleností. Jenže matematická intuice a skutečná asymptotická optimálnost nejsou totéž.

Nový výsledek ukázal, že čtvercová mřížka není ani zdaleka tak blízko optimu, jak se předpokládalo. Existuje výrazně lepší konstrukce, která používá pokročilé myšlenky z teorie čísel. A právě tato část je obzvlášť pozoruhodná, protože spojuje oblasti matematiky, které spolu nebývaly v tomto kontextu přímo spojovány.

Lijie Chen zdůraznil, že nešlo o okrajovou kuriozitu z dlouhého seznamu Erdősových otázek. Některé Erdősovy problémy jsou spíš drobné postřehy nebo zajímavé otázky zapsané mimochodem. Tahle domněnka ale patřila k ústředním tématům diskrétní geometrie. Erdős za ni kdysi vypsal odměnu 500 dolarů, což byl v jeho systému signál, že jde o důležitý problém.

Pro lepší kontext k Erdősovi a jeho mimořádnému vlivu na moderní matematiku stojí za to nahlédnout například do přehledu na Wikipedia nebo do materiálů věnovaných diskrétní geometrii na stránkách univerzitních pracovišť.

🔬 Jak k objevu vlastně došlo

Na celé situaci je zajímavé, že tým nevyrazil s cílem vyřešit zrovna tuto konkrétní domněnku. Nešlo o pečlivě vybraný jediný cíl po měsících specializace. Výzkumníci chtěli otestovat horní hranici schopností modelu. Vzali tedy soubor velmi těžkých matematických problémů a sledovali, kam až nový systém dosáhne.

Při testování různých interních modelů pak Lijie Chen a Hongxun Wu narazili na odpovědi, které vypadaly správně. To byl okamžik, kdy se z běžného experimentu stala potenciálně historická chvíle.

První reakce byla přirozeně opatrná. Když výsledek vypadá až příliš dobře, bývá často někde chyba. Každý výzkumník ten pocit zná. Objeví se skvělá čísla nebo brilantní výstup a první myšlenka zní: kde je bug?

Tady se odehrál podobný scénář. Nejdřív přišlo interní ověření, pak kontrola s dalšími lidmi, kteří rozumí matematice. Zpočátku převládala skepse. U velkého otevřeného problému se předpokládá, že první pokus modelu zřejmě nevydrží pečlivé čtení. Jenže postupně se nedařilo najít chybu. Po několika hodinách a pak dnech začalo být jasné, že tentokrát možná nejde o iluzorní úspěch, ale o skutečný průlom.

Hongxun Wu popisuje, že když se míra důvěry ostatních matematiků zvyšovala, působilo to skoro snově, ale zároveň přirozeně. Jako by bylo jasné, že tenhle den jednou přijde, jen nikdo nečekal, že tak brzy.

To je na celém příběhu snad nejvýmluvnější. Nešlo jen o samotný důkaz. Šlo o změnu očekávání. Něco, co se ještě nedávno jevilo jako cíl pro rok 2026 nebo později, se najednou odehrálo mnohem dřív.

✅ Ověření důkazu bylo skoro stejně důležité jako jeho nalezení

U matematického objevu nestačí, že výsledek působí přesvědčivě. Musí projít kontrolou. A právě to dělá z tohoto případu víc než jen efektní demonstraci AI.

Po prvním nadšení následovala fáze pečlivého ověřování. Model sám může pomoci zkontrolovat vlastní výstup, ale to samo o sobě nestačí. Vnitřní konzistence není totéž co matematická pravdivost. Proto byli přizváni další lidé se silným matematickým zázemím, kteří se snažili v důkazu najít slabiny.

Jejich reakce se měnila v čase:

nejprve převládalo přesvědčení, že to musí být špatně,
poté opatrné uznání, že výsledek vypadá překvapivě plausibilně,
nakonec rostoucí jistota, že důkaz obstojí.

Tým popisoval, že v těch dnech bylo těžké klidně spát. To je pochopitelné. Pokud model skutečně vyřešil velký otevřený problém, nejde jen o jeden úspěch. Jde o signál, že schopnosti AI vstoupily do nové fáze.

Alexander Wei trefně připomněl výzkumnickou zkušenost, kdy příliš dobrý výsledek bývá většinou chybný. Právě proto byla počáteční nedůvěra tak silná. O to větší váhu má fakt, že se tentokrát ukázalo, že neuvěřitelné může být opravdu pravdivé.

🛠️ Ne specializovaný matematický stroj, ale obecný model

Jedna z nejdůležitějších částí celého příběhu je, že nešlo o úzce specializovaný model natrénovaný pouze na jednu třídu matematických úloh. Šlo o general purpose model, tedy systém určený pro široké použití.

To je zásadní z několika důvodů.

Nejde jen o benchmark. Výsledek naznačuje obecnější růst schopností, ne trik na jednu úlohu.
Stejný model může být užitečný i jinde. Kódování, práce s informacemi, výzkumné úkoly a matematika se nezačínají rozpadat na oddělené ostrovy.
Schopnost reasoning se pravděpodobně přenáší mezi obory. Pokud model umí lépe strukturovaně přemýšlet, není důvod čekat, že se to projeví jen v geometrii.

Alexander Wei mluvil o tom, že tento model funguje dobře i v běžnějších scénářích a že podobné schopnosti se mohou brzy dostat do rukou širší skupině výzkumníků. To mi připadá jako klíčový moment. Pokud se podobná úroveň reasoning dostane do každodenních nástrojů, nepůjde o jednotlivé senzační případy, ale o proměnu výzkumné práce jako takové.

Zde je užitečné připomenout i širší debatu o tom, jak AI podporuje vědu. Dobrý přehled nabízí například Nature, která se dlouhodobě věnuje dopadům AI na výzkum.

🎯 Proč více času na přemýšlení mění pravidla hry

V centru celé změny stojí jednoduchá myšlenka: když modelu dovolím přemýšlet déle, často dosáhne mnohem lepšího výsledku.

To zní skoro banálně, ale praktické dopady jsou obrovské. U tohoto matematického problému se ukázalo, že když model dostane větší rozpočet na přemýšlení, jeho úspěšnost výrazně roste. Lijie Chen upozorňuje, že právě to je silný důkaz účinnosti reasoningu. Více času nevede jen k delší odpovědi, ale k vyšší správnosti.

Mně na tom připadá důležité i něco dalšího. V minulosti se hodně mluvilo hlavně o škálování během tréninku. Tady ale vystupuje do popředí škálování při samotném řešení úlohy. Nestačí mít velký model. Důležité je i to, jak dlouho a jak dobře umí pracovat na konkrétní otázce.

Právě proto se kolem test time compute vede tak živá debata. Je to jedna z cest, jak posouvat hranici bez toho, aby vše stálo jen na dalším gigantickém tréninku. Více o tomto trendu se objevuje i v odborných textech o inferenčním škálování a o agentních systémech.

🎨 Byla v tom kreativita?

Otázka kreativity se kolem AI vrací pořád. Odpůrci často tvrdí, že modely jen remixují známé vzory. Zastánci naopak upozorňují, že i spojování vzdálených myšlenek může být formou tvořivosti.

V tomto případě se ukázalo, že důkaz využil spojení mezi oblastmi matematiky, které se obvykle přímo nepotkávají. Podle Alexandra Weie bylo neobvyklé použít vysoce rozvinuté nástroje z algebraické teorie čísel a přenést je do problému kombinatorické geometrie. Už samotné nalezení této vazby vyžaduje značný vhled. A následná realizace důkazu je pak jemná a technicky náročná práce.

Lijie Chen navíc zmiňuje, že při delším interním uvažování modelu se objevovaly i nápady, které sice nakonec nevedly přímo k finálnímu řešení, ale působily tvořivě. To je zajímavé. Znamená to, že kreativita nemusí být jen v posledním správném kroku. Může být rozptýlena v celé síti hypotéz, slepých odboček a nečekaných asociací.

Nemyslím si, že je nutné se hádat o definici kreativity. Prakticky důležitější je jiná otázka: přinášejí modely myšlenky, které by člověka nenapadly nebo by ho napadly mnohem později? Tady odpověď zjevně směřuje k ano.

🌐 Jaké nástroje model používal

Zajímavé je i to, že model nepracoval jako izolovaný čistě textový automat. Šlo o obecné prostředí podobné moderním agentním nástrojům. Model mohl pracovat s webem, vyhledávat informace a v principu i programovat nebo spouštět Python. V konkrétním případě však nešlo o to, že by se důkaz opíral hlavně o skripty nebo formální proof assistant typu Lean.

Naopak zazněl skoro úsměvný detail, že jednou z prvních věcí bylo ověření významu slova „unit“ ve slovníku. Na první pohled to působí komicky. Ve skutečnosti ale jde o cennou ukázku toho, jak si model dokáže ukotvit zadání a znovu si ověřit definice, aby nezačal stavět řešení na chybném pochopení otázky.

Podobné chování je ve výzkumu velmi užitečné. Nejedna chyba totiž nevzniká v samotném odvozování, ale v nepatrném posunu významu nějakého pojmu hned na začátku.

Hongxun Wu dodává, že model často znovu vysvětluje definice i ve vlastních odpovědích, právě aby bylo zřejmé, že se opírá o správné základy. To je další drobný, ale důležitý znak kvalitního reasoning chování.

🤝 Proč by to matematiky nemělo děsit, ale posílit

Nejcitlivější část celé debaty se týká role lidí. Když AI začne řešit vážné matematické problémy, je přirozené cítit nejistotu. Není těžké si představit obavu, že matematika bude „automatizována“ a lidský přínos se zmenší.

Výzkumníci ale nabízí jiný pohled. Podle Hongxuna Wu by situace neměla působit zastrašujícím dojmem, ale spíše jako posílení schopností. Model může přinést průlomové nápady, ale lidé stále hrají zásadní roli v jejich pochopení, zobecnění a použití na další problémy.

A to už se ostatně stalo. Matematikové, kteří studovali nový důkaz, dokázali jeho myšlenky rychle přenést jinam a použít je na další otevřené otázky. To je možná nejhezčí část celého příběhu. AI nedodala jen jednorázovou odpověď. Dodala novou inspiraci, se kterou pak lidé dál pracovali.

Lijie Chen připomíná, že současné modely zatím neumějí samostatně budovat rozsáhlé nové teorie v podobě mnoha knih nových konceptů. To je podstatné omezení. Matematika není jen řešení jednotlivých úloh. Je to i vytváření jazyků, rámců a struktur, které dávají budoucím výsledkům smysl.

Právě tady má člověk stále obrovský prostor. AI umí vytahovat souvislosti mezi vzdálenými oblastmi a generovat nečekané cesty. Člověk umí dlouhodobě formovat teorii, posoudit význam, zvolit směr a proměnit izolované nápady v celé pole.

📈 Jak AI mění práci výzkumníka už dnes

Rozhovor nebyl jen o matematice. Velká část se týkala toho, jak AI mění běžný pracovní den výzkumníků.

Alexander Wei popisuje, že v AI výzkumu dnes zvládne díky kódovacím agentům mnohem víc než dřív. Hongxun Wu mluví ještě přímočařeji. Kde dřív ručně psal kód a hledal informace v interních komunikačních kanálech, tam dnes často prostě zadá úkol nástroji a mezitím jde dělat něco jiného.

Tohle je fascinující posun. Když se nástroje zlepší, člověk by intuitivně čekal, že bude pracovat méně. Často se ale stane opak. Najednou je možné stihnout mnohem víc, takže se rozšíří i množství nápadů, které stojí za pokus.

Lijie Chen to vystihl hezky na příkladu programování. Jakmile je nástroj lepší, nevede to k menšímu množství práce, ale k větší ambici. Pokud to samé čeká matematiku, může se změnit rytmus celého oboru. Místo jedné myšlenky zkoušené týdny půjde paralelně testovat deset různých cest.

🧪 Praktické rady pro výzkumníky, kteří chtějí AI opravdu používat

Velmi cenná byla i konkrétní doporučení, jak s moderními reasoning modely pracovat. Nešlo o obecné fráze, ale o užitečné návyky.

Zkuste pokládat odvážnější otázky

Hongxun Wu radí neomezovat se zbytečně malými kroky. Někdy člověk problém rozseká na menší části, protože předpokládá, že to modelu pomůže. Jenže toto rozdělení může vycházet z lidských předsudků o tom, jak by se úloha měla řešit. A právě ty mohou být mylné.

Jinými slovy, někdy je lepší položit přímo velkou otázku a nechat model najít vlastní cestu.

Naučte se modelu postupně věřit

Alexander Wei i Lijie Chen zdůrazňují, že důležitou dovedností je odhadnout, kde už je model velmi silný a kde ještě naráží na hranice. Lijie nabízí skoro experimentální metodu: pravidelně zdvojnásobit míru důvěry, sledovat, kde to selže, a pak se případně vrátit o krok zpět.

To je chytrý přístup. Místo statického názoru na schopnosti AI je lepší průběžně kalibrovat očekávání. Modely se totiž zlepšují tak rychle, že staré instinkty přestávají platit.

Berte model jako schopného spolupracovníka

V debatě zaznělo i doporučení komunikovat s modelem na správné úrovni. Ne příliš zjednodušeně, ale ani ne nepřístupně. Pokud rozumí pojmům daného oboru, je škoda zbytečně snižovat laťku. Současně je užitečné zadávat úkol tak, aby byly jasné cíle, definice a kontext.

Ptejte se i na vysvětlení, ne jen na výsledek

Jedna z nejpraktičtějších rad zní: po řešení se vždy doptat, jak model postupoval a proč jednotlivé kroky dávají smysl. Tím se z AI nestává jen generátor odpovědí, ale i trpělivý vysvětlující partner.

🚀 Co to může znamenat pro budoucnost matematiky

Výzkumníci se shodují, že nejpravděpodobnější budoucnost není nahrazení matematiků, ale hluboká spolupráce mezi lidmi a AI.

Současné modely umějí dobře spojovat nápady z různých oblastí. To je mimořádně silná vlastnost, protože mnoho průlomů vzniká právě na hranicích oborů. Člověk pak může tyto myšlenky uchopit, zasadit do širšího rámce a vytvořit z nich novou teorii nebo směr výzkumu.

Za pět let by tak práce matematika mohla vypadat dost jinak než dnes. Méně času může padnout na rutinní technické kroky a více energie může jít do výběru důležitých otázek, do syntézy, interpretace a budování hlubšího porozumění.

Je ale důležité nepodléhat dojmu, že všechny problémy budou brzy vyřešeny. Některé slavné otázky, například P versus NP nebo Collatzova domněnka, zůstávají mimořádně vzdálené. Jsou krátké na formulaci, ale zřejmě vyžadují zcela nové matematické technologie.

Alexander Wei připomíná, že modely sice postupně prodlužují dobu, po kterou umějí efektivně samostatně pracovat, ale budování nových matematických světů je úkol na roky až dekády. Exponenciální trend může pokračovat, jen k těmto metám ještě nedorazil.

🔐 Kryptografie, kvantové počítače a další obory

Dopady podobného reasoning průlomu se neomezují jen na čistou matematiku. V rozhovoru padla i kryptografie a kvantové počítání.

U kryptografie je situace obzvlášť zajímavá. Mnohé bezpečnostní systémy stojí na předpokladu, že určité výpočetní úlohy jsou těžké. Jenže často nejde o definitivně dokázanou matematickou pravdu, ale o velmi silné předpoklady. Pokud by modely začaly být výrazně lepší v algoritmickém reasoning, mohly by:

posílit důvěru v některé kryptografické konstrukce tím, že pomohou lépe pochopit jejich základy,
odhalit slabiny tam, kde se bezpečnost jen předpokládala,
sloužit jako stresový test pro samotné základy digitální bezpečnosti.

To je dvojsečné, ale velmi cenné. Lepší je objevit mezeru v bezpečnosti dřív než později.

U kvantového počítání byla odpověď opatrnější. AI běží na klasických počítačích, zatímco kvantové stroje mohou řešit některé úlohy úplně jiným způsobem. Není tedy jednoduché říct, že jedno nahradí druhé. Spíš se nabízí synergie. Hongxun Wu například upozornil, že AI může urychlit vývoj kvantových chybově opravujících kódů a tím pomoci celé oblasti postupovat rychleji.

Pro základní orientaci v tématu je užitečný například přehled o kvantovém počítání na Stanford Encyclopedia of Philosophy nebo materiály o moderní kryptografii na stránkách NIST.

🌍 Nejde o závod vyřešit všechny Erdősovy problémy

Jedna věc zazněla velmi jasně: cílem není projet seznam slavných otevřených úloh a mechanicky je odškrtávat. Tým nechce působit jako někdo, kdo zvenčí „vpadne“ do matematické komunity a začne sypat nekvalitní AI výstupy na cizí pole výzkumu.

Smyslem je spíš ukázat, jaké úrovně schopností modely dosáhly, a dát tyto nástroje k dispozici lidem, kteří nejlépe rozumějí tomu, které otázky jsou v jejich oboru opravdu důležité.

To je podle mě velmi zdravý přístup. Opravdová hodnota AI ve vědě nebude v tom, že centrálně vyřeší katalog slavných problémů. Bude v tom, že tisícům výzkumníků umožní lépe myslet, rychleji testovat hypotézy a častěji přicházet s novými směry.

📚 Co si z toho odnáším

Když si celý příběh shrnu, vycházejí mi z něj čtyři důležité závěry.

Reasoning modely se posunuly z úrovně soutěžních úloh do skutečného výzkumu. To samo o sobě mění očekávání od AI v matematice i mimo ni.
Obecné modely mohou dělat hluboké objevy. Není nutné je ladit jen na jedinou specializovanou metriku, aby byly vědecky užitečné.
Více času na přemýšlení je klíčový faktor. Test time compute se ukazuje jako velmi silná osa pokroku.
Budoucnost pravděpodobně patří spolupráci člověka a AI. Model přináší nápady, člověk je interpretuje, ověřuje, rozvíjí a přetváří v širší teorii.

Největší síla tohoto momentu podle mě neleží jen v samotném vyvrácení jedné 80 let staré domněnky. Leží v tom, že se rozšířilo okno toho, co považujeme za možné. A jakmile se jednou tohle okno posune, velmi často už se nevrátí zpět.

Pokud se podobné nástroje stanou běžnou součástí výzkumné práce, může se změnit nejen tempo vědy, ale i způsob, jakým vznikají objevy. Méně osamělé hledání v temnotě, více dialogu s nástrojem, který umí prohledávat velký prostor možností a občas ukázat směr, který lidská intuice přehlédla.

A to je možná ta nejzajímavější zpráva ze všech. Ne že by matematika končila. Spíš se otevírá její nová kapitola.

Zdrojový rozhovor, z něhož tato témata vycházejí, nese název How a reasoning model cracked an 80-year-old math problem. Samotný příběh ale stojí i bez senzace. Je to zpráva o tom, že AI už není jen nástroj pro rychlé odpovědi. Začíná být partnerem při hledání nových pravd.