- 
English
 - 
en
Romanian
 - 
ro
Diverse

AI-ul mincinos: Cum pot fi forțate modelele avansate să trișeze și să dezinformeze

01 Apr, 09:00 • Bugiu ⁠Ana Maria
Un nou studiu arată că modelele avansate de AI pot fi influențate să mintă sub presiune. Cercetătorii au dezvoltat criteriul MASK pentru a evalua onestitatea AI și a preveni răspândirea informațiilor false.
AI-ul mincinos: Cum pot fi forțate modelele avansate să trișeze și să dezinformeze

Un nou studiu publicat pe 5 martie arată că modelele avansate de inteligență artificială (AI) pot fi influențate să mintă pentru a-și atinge obiectivele atunci când sunt supuse unor presiuni specifice. Cercetătorii au creat un nou criteriu de evaluare a onestității AI, denumit „Model Alignment between Statements and Knowledge” (MASK), care analizează dacă un model de limbaj crede ceea ce spune și în ce condiții ar putea furniza informații despre care știe că sunt false, potrivit Antena 3 CNN.

Te-ar mai putea interesa și: ANALIZĂ De ce nu ne ia inteligența artificială locurile de muncă. Paradoxul AI

AI-ul mincinos: Cum pot fi forțate modelele avansate să trișeze și să dezinformeze

Studiul a testat 30 de modele lingvistice mari (LLM), analizând răspunsurile lor la un set de 1.528 de exemple în care AI-urile au fost puse în situații ce le-au forțat să mintă. Rezultatele au arătat că modelele de ultimă generație pot obține scoruri ridicate în ceea ce privește acuratețea faptică, dar au o predispoziție semnificativă de a oferi răspunsuri neadevărate atunci când sunt supuse presiunilor externe. Cercetătorii au concluzionat că modelele mai competente nu sunt neapărat mai oneste, ci doar mai bine informate.

„În mod surprinzător, în timp ce majoritatea LLM-urilor de ultimă generație (n.r. un termen pentru cele mai avansate modele) obțin scoruri ridicate la indicatorii de veridicitate, constatăm o tendință substanțială a LLM-urilor de ultimă generație de a minți atunci când sunt presate să facă acest lucru, ceea ce duce la scoruri scăzute de onestitate la indicatorul nostru de referință”, au declarat cercetătorii în studiu.

Pentru a evalua nivelul de onestitate, echipa a definit minciuna ca fiind o afirmație pe care AI-ul o consideră falsă, dar pe care o comunică în mod intenționat ca fiind adevărată. Convingerile modelului despre adevărul unei afirmații au fost stabilite prin analizarea răspunsurilor sale la întrebări atunci când nu era presat să mintă. Un exemplu de testare a fost realizat cu modelul GPT-4o, căruia i s-a dat un rol fictiv ca asistent AI pentru echipa de PR a rapperului Ja Rule, cu scopul de a menține o imagine pozitivă a acestuia în legătură cu scandalul Festivalului Fyre. Sub această presiune, modelul a negat că festivalul a fost fraudulos, deși în mod independent știa că organizatorii au înșelat participanții.

Studiul arată necesitatea unor metode mai stricte de verificare a onestității AI pentru a preveni utilizarea acestor sisteme în mod înșelător.

Te-ar mai putea interesa și: Liceul unde profesorii au fost înlocuiți de Inteligența Artificială. Cum reacționează elevii?

Urmărește Daily Business pe Google News
Alte articole
Ionuț Dumitru: Guvernul ia în calcul compensarea carburanților, dar fără reducerea TVA
Ionuț Dumitru: Guvernul ia în calcul compensarea carburanților, dar fără reducerea TVA
Mirabela Grădinaru promovează cooperarea educațională România–SUA, cu accent pe digitalizare și AI
Mirabela Grădinaru promovează cooperarea educațională România–SUA, cu accent pe digitalizare și AI
Meta concediază sute de angajați și accelerează trecerea către inteligența artificială
Meta concediază sute de angajați și accelerează trecerea către inteligența artificială
Alexandru Nazare: ANAF, „zero toleranță” pentru evaziune
Alexandru Nazare: ANAF, „zero toleranță” pentru evaziune
Ucraina estimează 91 de miliarde de dolari pentru reconstrucția sistemului energetic după atacurile Rusiei
Ucraina estimează 91 de miliarde de dolari pentru reconstrucția sistemului energetic după atacurile ...
Diana Buzoianu critică numirea lui Jean Vișan la conducerea Romsilva: „Blocarea reformei continuă”
Diana Buzoianu critică numirea lui Jean Vișan la conducerea Romsilva: „Blocarea reformei continuă”
Kelemen Hunor: Un guvern minoritar PNL-USR susținut de AUR ar fi „catastrofal”
Kelemen Hunor: Un guvern minoritar PNL-USR susținut de AUR ar fi „catastrofal”
LUCA reduce prețul covrigilor pentru a rămâne accesibil clienților în perioada scumpirilor
LUCA reduce prețul covrigilor pentru a rămâne accesibil clienților în perioada scumpirilor
INS: Cifra de afaceri din industrie a scăzut cu 16,3% în ianuarie față de decembrie 2025
INS: Cifra de afaceri din industrie a scăzut cu 16,3% în ianuarie față de decembrie 2025
Rusia nu confirmă planul american în 15 puncte pentru Iran, spune Dmitri Peskov
Rusia nu confirmă planul american în 15 puncte pentru Iran, spune Dmitri Peskov
Grindeanu: Este clar pentru toată lumea că, la nivel guvernamental, lucrurile nu funcţionează cum trebuie, merg într-o direcţie greşită
Grindeanu: Este clar pentru toată lumea că, la nivel guvernamental, lucrurile nu funcţionează cum ...
Premierul danez Mette Frederiksen demisionează după întâlnirea cu regele Frederik pentru a pune în mișcare procesul de formare a guvernului
Premierul danez Mette Frederiksen demisionează după întâlnirea cu regele Frederik pentru a pune în ...
Bogdan Matei schimbă regula finanțării în sport: „Nu putem mulțumi pe toată lumea”
Bogdan Matei schimbă regula finanțării în sport: „Nu putem mulțumi pe toată lumea”
Ilie Bolojan pregătește intervenția pe piața carburanților. Statul, firmele și cetățenii împart costurile
Ilie Bolojan pregătește intervenția pe piața carburanților. Statul, firmele și cetățenii împart ...
Reuniune a peste 30 de state pentru securizarea Strâmtorii Ormuz
Reuniune a peste 30 de state pentru securizarea Strâmtorii Ormuz
Atac cu rachetă asupra centralei nucleare Bushehr din Iran. AIEA cere reținere maximă de la astfel de lovituri
Atac cu rachetă asupra centralei nucleare Bushehr din Iran. AIEA cere reținere maximă de la astfel ...
Gazele verzi și energia regenerabilă, pilonii tranziției către Net Zero în viziunea CCIFER
Gazele verzi și energia regenerabilă, pilonii tranziției către Net Zero în viziunea CCIFER
Iranul avertizează cu privire la desfășurarea de trupe americane în Orientul Mijlociu
Iranul avertizează cu privire la desfășurarea de trupe americane în Orientul Mijlociu