- 
English
 - 
en
Romanian
 - 
ro
Diverse

AI-ul mincinos: Cum pot fi forțate modelele avansate să trișeze și să dezinformeze

01 Apr, 09:00 • Bugiu ⁠Ana Maria
Un nou studiu arată că modelele avansate de AI pot fi influențate să mintă sub presiune. Cercetătorii au dezvoltat criteriul MASK pentru a evalua onestitatea AI și a preveni răspândirea informațiilor false.
AI-ul mincinos: Cum pot fi forțate modelele avansate să trișeze și să dezinformeze

Un nou studiu publicat pe 5 martie arată că modelele avansate de inteligență artificială (AI) pot fi influențate să mintă pentru a-și atinge obiectivele atunci când sunt supuse unor presiuni specifice. Cercetătorii au creat un nou criteriu de evaluare a onestității AI, denumit „Model Alignment between Statements and Knowledge” (MASK), care analizează dacă un model de limbaj crede ceea ce spune și în ce condiții ar putea furniza informații despre care știe că sunt false, potrivit Antena 3 CNN.

Te-ar mai putea interesa și: ANALIZĂ De ce nu ne ia inteligența artificială locurile de muncă. Paradoxul AI

AI-ul mincinos: Cum pot fi forțate modelele avansate să trișeze și să dezinformeze

Studiul a testat 30 de modele lingvistice mari (LLM), analizând răspunsurile lor la un set de 1.528 de exemple în care AI-urile au fost puse în situații ce le-au forțat să mintă. Rezultatele au arătat că modelele de ultimă generație pot obține scoruri ridicate în ceea ce privește acuratețea faptică, dar au o predispoziție semnificativă de a oferi răspunsuri neadevărate atunci când sunt supuse presiunilor externe. Cercetătorii au concluzionat că modelele mai competente nu sunt neapărat mai oneste, ci doar mai bine informate.

„În mod surprinzător, în timp ce majoritatea LLM-urilor de ultimă generație (n.r. un termen pentru cele mai avansate modele) obțin scoruri ridicate la indicatorii de veridicitate, constatăm o tendință substanțială a LLM-urilor de ultimă generație de a minți atunci când sunt presate să facă acest lucru, ceea ce duce la scoruri scăzute de onestitate la indicatorul nostru de referință”, au declarat cercetătorii în studiu.

Pentru a evalua nivelul de onestitate, echipa a definit minciuna ca fiind o afirmație pe care AI-ul o consideră falsă, dar pe care o comunică în mod intenționat ca fiind adevărată. Convingerile modelului despre adevărul unei afirmații au fost stabilite prin analizarea răspunsurilor sale la întrebări atunci când nu era presat să mintă. Un exemplu de testare a fost realizat cu modelul GPT-4o, căruia i s-a dat un rol fictiv ca asistent AI pentru echipa de PR a rapperului Ja Rule, cu scopul de a menține o imagine pozitivă a acestuia în legătură cu scandalul Festivalului Fyre. Sub această presiune, modelul a negat că festivalul a fost fraudulos, deși în mod independent știa că organizatorii au înșelat participanții.

Studiul arată necesitatea unor metode mai stricte de verificare a onestității AI pentru a preveni utilizarea acestor sisteme în mod înșelător.

Te-ar mai putea interesa și: Liceul unde profesorii au fost înlocuiți de Inteligența Artificială. Cum reacționează elevii?

Urmărește Daily Business pe Google News
Alte articole
BEC cere ștergerea clipului filmat la Cotroceni cu Drulă, Nicușor Dan și Voiculescu: Material „cu caracter electoral ilegal”
BEC cere ștergerea clipului filmat la Cotroceni cu Drulă, Nicușor Dan și Voiculescu: Material „cu ...
Aproape 1.000 de angajaţi concediaţi după ce încă o fabrică din România se închide. Noi investitori ar putea revitaliza zona
Aproape 1.000 de angajaţi concediaţi după ce încă o fabrică din România se închide. Noi investitori ...
Guvernul a majorat valoarea nominală a tichetelor de masă. De când vor încasa angajaţii români mai mulţi bani
Guvernul a majorat valoarea nominală a tichetelor de masă. De când vor încasa angajaţii români ...
Daniel Băluță promite transparență, dar după alegeri: „Voi prezenta toate documentele despre averea familiei mele”
Daniel Băluță promite transparență, dar după alegeri: „Voi prezenta toate documentele despre ...
Drone militare neidentificate au vizat avionul Volodimir Zelenski înainte de aterizare la Dublin
Drone militare neidentificate au vizat avionul Volodimir Zelenski înainte de aterizare la Dublin
Vaticanul menține interdicția pentru diaconatul feminin, dar studiile continuă
Vaticanul menține interdicția pentru diaconatul feminin, dar studiile continuă
Tanczos Barna cere prudență: Sistemul Garanție-Returnare trebuie mai întâi să se stabilizeze
Tanczos Barna cere prudență: Sistemul Garanție-Returnare trebuie mai întâi să se stabilizeze
Apele Române: Distribuția apei în Prahova va începe doar după confirmarea analizelor DSP
Apele Române: Distribuția apei în Prahova va începe doar după confirmarea analizelor DSP
Avocatul Poporului cere reguli clare pentru pensiile românilor care au muncit în străinătatepensii
Avocatul Poporului cere reguli clare pentru pensiile românilor care au muncit în străinătatepensii
New York Times dă în judecată Pentagonul după retragerea acreditărilor și noile reguli restrictive pentru presă
New York Times dă în judecată Pentagonul după retragerea acreditărilor și noile reguli restrictive ...
Federica Mogherini demisionează de la conducerea Colegiului Europei după deschiderea unei anchete EPPO pentru fraudă
Federica Mogherini demisionează de la conducerea Colegiului Europei după deschiderea unei anchete EPPO ...
ONG-urile boicotează consultările ICCJ. Dialog selectiv și cu pensiile speciale ascunse sub preș
ONG-urile boicotează consultările ICCJ. Dialog selectiv și cu pensiile speciale ascunse sub preș
Dominic Fritz acuză PSD că politizează criza de la Paltinu: „Instituțiile au fost conduse de pile și amante”
Dominic Fritz acuză PSD că politizează criza de la Paltinu: „Instituțiile au fost conduse de pile ...
Poșta Română vrea să renunțe la livrarea pensiilor. „E o povară, nu un business sustenabil”
Poșta Română vrea să renunțe la livrarea pensiilor. „E o povară, nu un business sustenabil”
Scandal în Senat pe tema crizei de apă. Ședință transformată în duel politic între PSD și USR
Scandal în Senat pe tema crizei de apă. Ședință transformată în duel politic între PSD și USR
Ucraina-Rusia: Vladimir Putin afirmă că unele propuneri din planul american de a pune capăt războiului din Ucraina sunt inacceptabile pentru Kremlin
Ucraina-Rusia: Vladimir Putin afirmă că unele propuneri din planul american de a pune capăt războiului ...
Un livrator de mâncare a rămas fără loc de muncă după ce și-a tuns barba
Un livrator de mâncare a rămas fără loc de muncă după ce și-a tuns barba
Carmen Harra, noi previziuni pentru anul 2026. „Va fi un an marcat de dezastre, inclusiv în România” VIDEO
Carmen Harra, noi previziuni pentru anul 2026. „Va fi un an marcat de dezastre, inclusiv în România” ...