- 
English
 - 
en
Romanian
 - 
ro
Diverse

Un chatbot genial i-a uimit pe cei mai buni matematicieni ai lumii: A rezolvat în 10 minute ce ne ia luni întregi

26 Jul, 09:35 • Bugiu ⁠Ana Maria
Într-o întâlnire secretă desfășurată în California, 30 de matematicieni de top s-au confruntat cu o inteligență artificială avansată, capabilă să rezolve probleme matematice la nivel de doctorat în timp record. Ce au descoperit i-a făcut să-și reconsidere complet viitorul profesiei.
Un chatbot genial i-a uimit pe cei mai buni matematicieni ai lumii: A rezolvat în 10 minute ce ne ia luni întregi

Într-un weekend de la mijlocul lunii mai, la Berkeley, California, a avut loc o reuniune secretă, organizată sub formă de conclav, la care au participat 30 dintre cei mai respectați matematicieni din lume. Scopul întâlnirii a fost testarea capacităților unui nou model avansat de inteligență artificială, o4-mini, un model de limbaj de tip LLM (Large Language Model) specializat în raționament matematic.

Te-ar mai putea interesa și: Evaluarea Națională 2025. Elevii clasei a VIII-a continuă examenele cu proba la matematică

Un chatbot genial i-a uimit pe cei mai buni matematicieni ai lumii: A rezolvat în 10 minute ce ne ia luni întregi

Acești experți în matematică, aleși pentru a participa în proiectul FrontierMath organizat de organizația Epoch AI, au fost însărcinați să conceapă probleme dificile, care să pună la încercare limitele gândirii matematice ale modelului AI. Atmosfera a fost una de maximă discreție, participanții fiind obligați să semneze acorduri de confidențialitate și să comunice doar prin aplicația criptată Signal, pentru a evita orice „contaminare” a datelor cu întrebări ce ar putea fi reutilizate de AI în antrenamente viitoare.

o4-mini, antrenat de OpenAI, este considerat un pas important în dezvoltarea modelelor capabile de raționament logic profund, depășind performanțele versiunilor tradiționale ale LLM-urilor, ca cele folosite anterior în ChatGPT. Prin antrenamente specifice și întărire din partea experților umani, o4-mini a fost conceput pentru a rezolva probleme matematice de o complexitate ridicată.

Testarea reală a fost lansată anterior, când Epoch AI a propus un set de 300 de întrebări matematici inedite. Modelele clasice au eșuat lamentabil, cele mai bune reușind să rezolve sub 2% dintre probleme. Spre deosebire de ele, o4-mini a obținut un scor de circa 20% în doar câteva luni de testare, iar ulterior a început să rezolve chiar și probleme de nivel doctoral, extrem de dificile, pe care doar o mână de oameni din lume le-ar putea înțelege, darămite rezolva.

În timpul întâlnirii din mai, participanții au fost împărțiți în echipe și s-au întrecut în a concepe întrebări care să blocheze chatbotul. Fiecare problemă nerezolvată de AI era recompensată cu 7.500 de dolari, dar sarcina s-a dovedit mai dificilă decât se anticipase.

De exemplu, Ken Ono, profesor de matematică la Universitatea din Virginia și lider al evenimentului, a propus o problemă avansată de teorie a numerelor. Spre surprinderea lui, o4-mini nu doar că a înțeles problema, dar a parcurs literatura de specialitate în câteva minute, a rezolvat o versiune simplificată a problemei pentru a-și testa înțelegerea și apoi a prezentat o soluție corectă în timp real, comentând ironic că „nu este necesară citarea, deoarece numărul a fost calculat de mine!”.

Pentru Ono și ceilalți matematicieni, această demonstrație de raționament a fost uluitoare, dar și ușor neliniștitoare. Era evident că se confruntau nu cu un simplu model statistic, ci cu un „colaborator puternic”, după cum l-a numit chiar el.

În cele din urmă, cercetătorii au reușit să formuleze zece întrebări care au pus în dificultate modelul o4-mini. Cu toate acestea, impresia generală a fost că AI-ul nu doar că rezolva probleme de mare dificultate, ci o făcea cu o viteză incomparabil mai mare decât orice expert uman, în câteva minute, față de săptămâni sau luni necesare unui matematician profesionist.

Cu toate aceste reușite, participanții și-au exprimat îngrijorarea cu privire la un viitor în care AI-ul ar putea deveni atât de puternic încât să intimideze sau să eclipseze gândirea umană. Matematicianul Yang Hui He a remarcat că o4-mini oferă soluții cu o încredere atât de mare, încât se impune prin autoritate, un fenomen pe care l-a numit „dovadă prin intimidare”.

Pe măsură ce evenimentul se apropia de final, discuțiile s-au îndreptat către posibila apariție a unui „nivel 5”, întrebări pe care niciun matematician uman nu le poate rezolva.

Te-ar mai putea interesa și: Bacalaureat 2025. Subiecte MATEMATICĂ și ISTORIE. Ce au primit elevii la proba obligatorie a profilului

Urmărește Daily Business pe Google News
Alte articole
Carburanții ating prețuri record. Benzina trece de 9 lei, motorina se apropie de 10 lei
Carburanții ating prețuri record. Benzina trece de 9 lei, motorina se apropie de 10 lei
Nicușor Dan: Majoritatea parlamentară trebuie să reziste, iar alegerile anticipate sunt excluse
Nicușor Dan: Majoritatea parlamentară trebuie să reziste, iar alegerile anticipate sunt excluse
Ministrul de externe al Omanului susține că Israelul a împins SUA într-un război cu Iranul, deși un acord era posibil
Ministrul de externe al Omanului susține că Israelul a împins SUA într-un război cu Iranul, deși ...
Bolojan: „Cea mai gravă greșeală ar fi să ne relaxăm acum”
Bolojan: „Cea mai gravă greșeală ar fi să ne relaxăm acum”
Reacția ICCJ după ce i-a fost redus bugetul
Reacția ICCJ după ce i-a fost redus bugetul
Un avion de vânătoare american F-35, avariat de iranieni, a efectuat o aterizare de urgență
Un avion de vânătoare american F-35, avariat de iranieni, a efectuat o aterizare de urgență
Comisiile de buget din Parlament au avizat bugetul asigurărilor sociale pentru 2026, în valoare de 158,9 mld. lei
Comisiile de buget din Parlament au avizat bugetul asigurărilor sociale pentru 2026, în valoare de ...
UE nu reușește să deblocheze împrumutul de 90 mld. euro pentru Ucraina, din cauza opoziției lui Viktor Orban
UE nu reușește să deblocheze împrumutul de 90 mld. euro pentru Ucraina, din cauza opoziției lui ...
Secretarul apărării american, Pete Hegseth: „Luptăm pentru a câștiga și câștigăm în propriii noștri termeni”
Secretarul apărării american, Pete Hegseth: „Luptăm pentru a câștiga și câștigăm în propriii ...
Prețul petrolului a sărit de 116 dolari/barilul după atacurile Iranului asupra infrastructurii energetice din Golf
Prețul petrolului a sărit de 116 dolari/barilul după atacurile Iranului asupra infrastructurii energetice ...
OMI estimează că 3.200 de nave cu 20.000 de marinari la bord sunt blocate în apropierea Strâmtorii Ormuz
OMI estimează că 3.200 de nave cu 20.000 de marinari la bord sunt blocate în apropierea Strâmtorii ...
Dragoș Pîslaru: Bugetul nu este un exercițiu de imagine, ci un test de responsabilitate politică
Dragoș Pîslaru: Bugetul nu este un exercițiu de imagine, ci un test de responsabilitate politică
Ministerul Finanțelor atrage aproape 1,2 miliarde de lei prin titlurile de stat Fidelis listate la BVB
Ministerul Finanțelor atrage aproape 1,2 miliarde de lei prin titlurile de stat Fidelis listate la BVB
Încă 1 miliard de lei din bugetul ICCJ a fost luat pentru a merge la primăriile cu datorii
Încă 1 miliard de lei din bugetul ICCJ a fost luat pentru a merge la primăriile cu datorii
Ministerul Energiei: stocurile de urgență de peste 102% asigură consumul intern și accesul la carburanți pentru 90 de zile
Ministerul Energiei: stocurile de urgență de peste 102% asigură consumul intern și accesul la carburanți ...
NATO a ridicat avioane de luptă după ce un SU-30 rus a încălcat spațiul aerian estonian
NATO a ridicat avioane de luptă după ce un SU-30 rus a încălcat spațiul aerian estonian
Labubu ajunge pe marele ecran. Sony și Pop Mart pregătesc un film cu regizorul Paddington
Labubu ajunge pe marele ecran. Sony și Pop Mart pregătesc un film cu regizorul Paddington
Isărescu: „Dacă nu corectăm deficitul bugetar, pierdem tot ce-am câștigat în ultimele luni”
Isărescu: „Dacă nu corectăm deficitul bugetar, pierdem tot ce-am câștigat în ultimele luni”