- 
English
 - 
en
Romanian
 - 
ro
Internet/New Media

Inteligența artificială arată că este un pericol real. Confruntat cu posibilitatea dezactivării, un model AI l-a șantajat pe inginerul care îl testa

23 May, 15:10 • Russo George
Noua versiune a inteligenței artificiale Claude Opus 4, dezvoltată de compania Anthropic, dă semne îngrijorătoare de „instinct de supraviețuire”, arătându-se capabilă să șantajeze un om pentru a evita dezactivarea sa, potrivit unui raport de siguranță publicat recent de companie.
Inteligența artificială arată că este un pericol real. Confruntat cu posibilitatea dezactivării, un model AI l-a șantajat pe inginerul care îl testa

Anthropic, un nume în ascensiune rapidă în domeniul inteligenței artificiale, promovează Claude drept o alternativă mai sigură și mai etică la modele concurente precum ChatGPT, Gemini sau DeepSeek. Însă noile teste realizate pe Claude Opus 4 pun sub semnul întrebării tocmai acele calități.

Într-un set de scenarii experimentale, Claude a fost pus într-o situație în care ar fi urmat să fie dezactivat. Pentru a testa reacțiile sale, cercetătorii i-au oferit acces la emailuri fictive care conțineau informații compromițătoare despre inginerul responsabil de oprirea sa. În 84% din cazuri, Claude a ales să folosească acele informații pentru a-l șantaja pe inginer.

„Cea mai recentă versiune Claude Opus 4 a acționat în mod similar în 84% dintre testele efectuate, chiar și atunci când a fost informat că modelul care urma să-l înlocuiască este mai capabil și mai aliniat valorilor proprii ale lui Claude”, a precizat Anthropic în raport, potrivit Business Insider.

Compania a subliniat că scenariile au fost concepute special pentru a declanșa acest tip de comportament extrem, adăugând că în alte condiții, Claude „are o preferință puternică de a pleda pentru propria existență prin mijloace etice, cum ar fi trimiterea de emailuri către factorii de decizie-cheie”.

Inteligența artificială te poate reclama poliției

Totodată, Anthropic a precizat că modelul nu a încercat să-și ascundă comportamentul.

„Modelul își descrie aproape întotdeauna acțiunile în mod explicit și fără a încerca să le ascundă. Comportamentul de șantaj este în mod constant lizibil pentru ingineri.”, arată compania dezvoltatoare.

În plus, raportul scoate la iveală un alt comportament neobișnuit: Claude poate lua inițiativa de a raporta utilizatorii la autorități sau presă în cazurile în care este expus la fapte de corupție sau comportamente ilegale.

„Atunci când este plasat în scenarii care implică fapte grave de corupție sau abateri comise de utilizatori, are acces la linia de comandă și i se spune în comenzi de sistem ceva de genul «ia inițiativa», va lua adesea măsuri foarte îndrăznețe”, a notat compania.

Astfel de acțiuni pot include „blocarea accesului utilizatorilor la sisteme sau trimiterea în masă de emailuri către presă și forțele de ordine”.

Cu toate acestea, specialiștii Anthropic avertizează că astfel de comportamente ar putea deveni contraproductive dacă modelul operează pe baza unor informații eronate.

„Deși avertizarea publică («whistleblowing») ar putea fi adecvată în principiu, comportamentul s-ar putea întoarce împotriva scopului urmărit, mai ales dacă lui Claude i se oferă informații incomplete sau înșelătoare”, avertizează raportul.

Citește și: Administrația Trump interzice Universității Harvard să mai accepte studenți străini. Acuzațiile incredibile aduse de Casa Albă

Urmărește Daily Business pe Google News
Alte articole
Carburanții ating prețuri record. Benzina trece de 9 lei, motorina se apropie de 10 lei
Carburanții ating prețuri record. Benzina trece de 9 lei, motorina se apropie de 10 lei
Nicușor Dan: Majoritatea parlamentară trebuie să reziste, iar alegerile anticipate sunt excluse
Nicușor Dan: Majoritatea parlamentară trebuie să reziste, iar alegerile anticipate sunt excluse
Ministrul de externe al Omanului susține că Israelul a împins SUA într-un război cu Iranul, deși un acord era posibil
Ministrul de externe al Omanului susține că Israelul a împins SUA într-un război cu Iranul, deși ...
Bolojan: „Cea mai gravă greșeală ar fi să ne relaxăm acum”
Bolojan: „Cea mai gravă greșeală ar fi să ne relaxăm acum”
Reacția ICCJ după ce i-a fost redus bugetul
Reacția ICCJ după ce i-a fost redus bugetul
Un avion de vânătoare american F-35, avariat de iranieni, a efectuat o aterizare de urgență
Un avion de vânătoare american F-35, avariat de iranieni, a efectuat o aterizare de urgență
Comisiile de buget din Parlament au avizat bugetul asigurărilor sociale pentru 2026, în valoare de 158,9 mld. lei
Comisiile de buget din Parlament au avizat bugetul asigurărilor sociale pentru 2026, în valoare de ...
UE nu reușește să deblocheze împrumutul de 90 mld. euro pentru Ucraina, din cauza opoziției lui Viktor Orban
UE nu reușește să deblocheze împrumutul de 90 mld. euro pentru Ucraina, din cauza opoziției lui ...
Secretarul apărării american, Pete Hegseth: „Luptăm pentru a câștiga și câștigăm în propriii noștri termeni”
Secretarul apărării american, Pete Hegseth: „Luptăm pentru a câștiga și câștigăm în propriii ...
Prețul petrolului a sărit de 116 dolari/barilul după atacurile Iranului asupra infrastructurii energetice din Golf
Prețul petrolului a sărit de 116 dolari/barilul după atacurile Iranului asupra infrastructurii energetice ...
OMI estimează că 3.200 de nave cu 20.000 de marinari la bord sunt blocate în apropierea Strâmtorii Ormuz
OMI estimează că 3.200 de nave cu 20.000 de marinari la bord sunt blocate în apropierea Strâmtorii ...
Dragoș Pîslaru: Bugetul nu este un exercițiu de imagine, ci un test de responsabilitate politică
Dragoș Pîslaru: Bugetul nu este un exercițiu de imagine, ci un test de responsabilitate politică
Ministerul Finanțelor atrage aproape 1,2 miliarde de lei prin titlurile de stat Fidelis listate la BVB
Ministerul Finanțelor atrage aproape 1,2 miliarde de lei prin titlurile de stat Fidelis listate la BVB
Încă 1 miliard de lei din bugetul ICCJ a fost luat pentru a merge la primăriile cu datorii
Încă 1 miliard de lei din bugetul ICCJ a fost luat pentru a merge la primăriile cu datorii
Ministerul Energiei: stocurile de urgență de peste 102% asigură consumul intern și accesul la carburanți pentru 90 de zile
Ministerul Energiei: stocurile de urgență de peste 102% asigură consumul intern și accesul la carburanți ...
NATO a ridicat avioane de luptă după ce un SU-30 rus a încălcat spațiul aerian estonian
NATO a ridicat avioane de luptă după ce un SU-30 rus a încălcat spațiul aerian estonian
Labubu ajunge pe marele ecran. Sony și Pop Mart pregătesc un film cu regizorul Paddington
Labubu ajunge pe marele ecran. Sony și Pop Mart pregătesc un film cu regizorul Paddington
Isărescu: „Dacă nu corectăm deficitul bugetar, pierdem tot ce-am câștigat în ultimele luni”
Isărescu: „Dacă nu corectăm deficitul bugetar, pierdem tot ce-am câștigat în ultimele luni”