- 
English
 - 
en
Romanian
 - 
ro
Diverse

AI-ul mincinos: Cum pot fi forțate modelele avansate să trișeze și să dezinformeze

01 Apr, 09:00 • Bugiu ⁠Ana Maria
Un nou studiu arată că modelele avansate de AI pot fi influențate să mintă sub presiune. Cercetătorii au dezvoltat criteriul MASK pentru a evalua onestitatea AI și a preveni răspândirea informațiilor false.
AI-ul mincinos: Cum pot fi forțate modelele avansate să trișeze și să dezinformeze

Un nou studiu publicat pe 5 martie arată că modelele avansate de inteligență artificială (AI) pot fi influențate să mintă pentru a-și atinge obiectivele atunci când sunt supuse unor presiuni specifice. Cercetătorii au creat un nou criteriu de evaluare a onestității AI, denumit „Model Alignment between Statements and Knowledge” (MASK), care analizează dacă un model de limbaj crede ceea ce spune și în ce condiții ar putea furniza informații despre care știe că sunt false, potrivit Antena 3 CNN.

Te-ar mai putea interesa și: ANALIZĂ De ce nu ne ia inteligența artificială locurile de muncă. Paradoxul AI

AI-ul mincinos: Cum pot fi forțate modelele avansate să trișeze și să dezinformeze

Studiul a testat 30 de modele lingvistice mari (LLM), analizând răspunsurile lor la un set de 1.528 de exemple în care AI-urile au fost puse în situații ce le-au forțat să mintă. Rezultatele au arătat că modelele de ultimă generație pot obține scoruri ridicate în ceea ce privește acuratețea faptică, dar au o predispoziție semnificativă de a oferi răspunsuri neadevărate atunci când sunt supuse presiunilor externe. Cercetătorii au concluzionat că modelele mai competente nu sunt neapărat mai oneste, ci doar mai bine informate.

„În mod surprinzător, în timp ce majoritatea LLM-urilor de ultimă generație (n.r. un termen pentru cele mai avansate modele) obțin scoruri ridicate la indicatorii de veridicitate, constatăm o tendință substanțială a LLM-urilor de ultimă generație de a minți atunci când sunt presate să facă acest lucru, ceea ce duce la scoruri scăzute de onestitate la indicatorul nostru de referință”, au declarat cercetătorii în studiu.

Pentru a evalua nivelul de onestitate, echipa a definit minciuna ca fiind o afirmație pe care AI-ul o consideră falsă, dar pe care o comunică în mod intenționat ca fiind adevărată. Convingerile modelului despre adevărul unei afirmații au fost stabilite prin analizarea răspunsurilor sale la întrebări atunci când nu era presat să mintă. Un exemplu de testare a fost realizat cu modelul GPT-4o, căruia i s-a dat un rol fictiv ca asistent AI pentru echipa de PR a rapperului Ja Rule, cu scopul de a menține o imagine pozitivă a acestuia în legătură cu scandalul Festivalului Fyre. Sub această presiune, modelul a negat că festivalul a fost fraudulos, deși în mod independent știa că organizatorii au înșelat participanții.

Studiul arată necesitatea unor metode mai stricte de verificare a onestității AI pentru a preveni utilizarea acestor sisteme în mod înșelător.

Te-ar mai putea interesa și: Liceul unde profesorii au fost înlocuiți de Inteligența Artificială. Cum reacționează elevii?

Urmărește Daily Business pe Google News
Alte articole
Programul Rabla continuă în 2026 cu buget suplimentat. Încă 100 de milioane de lei pentru înnoirea parcului auto
Programul Rabla continuă în 2026 cu buget suplimentat. Încă 100 de milioane de lei pentru înnoirea ...
Sorin Grindeanu: Nicușor Dan, „o surpriză plăcută” prin eforturile de a construi o majoritate pro-occidentală
Sorin Grindeanu: Nicușor Dan, „o surpriză plăcută” prin eforturile de a construi o majoritate ...
Tanczos Barna cere prelungirea plafonării adaosului comercial la alimentele de bază
Tanczos Barna cere prelungirea plafonării adaosului comercial la alimentele de bază
Traian Băsescu: România nu este dependentă de Strâmtoarea Ormuz și are surse alternative de aprovizionare cu petrol
Traian Băsescu: România nu este dependentă de Strâmtoarea Ormuz și are surse alternative de aprovizionare ...
RENAR: Metrologia și acreditarea, esențiale pentru siguranța pieței și încrederea în politicile publice
RENAR: Metrologia și acreditarea, esențiale pentru siguranța pieței și încrederea în politicile ...
Oana Gheorghiu, reclamată la DNA de Dragoș Vlad. Fostul șef ADR acuză presiuni pe proiectul PNI
Oana Gheorghiu, reclamată la DNA de Dragoș Vlad. Fostul șef ADR acuză presiuni pe proiectul PNI
OMS declară alertă internațională din cauza focarului de Ebola din Congo, dar riscul global rămâne scăzut
OMS declară alertă internațională din cauza focarului de Ebola din Congo, dar riscul global rămâne ...
Iranul amenință că va extinde conflictul „dincolo de regiune” dacă SUA și Israelul își reiau atacurile
Iranul amenință că va extinde conflictul „dincolo de regiune” dacă SUA și Israelul își reiau ...
Dom de căldură peste Europa. Temperaturi de vară în vest, vreme instabilă în România
Dom de căldură peste Europa. Temperaturi de vară în vest, vreme instabilă în România
Reguli noi pentru carnea de porc. Etichete mai clare și controale în supermarketuri anunțate de Ministerul Agriculturii
Reguli noi pentru carnea de porc. Etichete mai clare și controale în supermarketuri anunțate de Ministerul ...
Miniștrii de externe ai țărilor membre NATO se reunesc în Suedia pe 21–22 mai 2026
Miniștrii de externe ai țărilor membre NATO se reunesc în Suedia pe 21–22 mai 2026
Grindeanu sesizează CCR în legătură cu ordonanţa „SAFE” adoptată de Guvernul Bolojan
Grindeanu sesizează CCR în legătură cu ordonanţa „SAFE” adoptată de Guvernul Bolojan
„Campioana” inflației în UE. Prețurile cresc de peste trei ori mai rapid decât media europeană
„Campioana” inflației în UE. Prețurile cresc de peste trei ori mai rapid decât media europeană
Sondaj INSCOP: Românii, împărțiți în privința lui Nicușor Dan și Ilie Bolojan. Nemulțumirea domină evaluările
Sondaj INSCOP: Românii, împărțiți în privința lui Nicușor Dan și Ilie Bolojan. Nemulțumirea ...
Ilie Bolojan s-a întâlnit cu șeful Dacia România. Discuțiile au vizat Programul Rabla, prețul energiei și achizițiile publice
Ilie Bolojan s-a întâlnit cu șeful Dacia România. Discuțiile au vizat Programul Rabla, prețul energiei ...
APIA a primit peste 500.000 de cereri pentru subvențiile agricole, iar termenul-limită din 5 iunie nu va fi prelungit
APIA a primit peste 500.000 de cereri pentru subvențiile agricole, iar termenul-limită din 5 iunie ...
Bugetul TAROM, considerat nerealist de Radu Miruță, amânat la aprobare
Bugetul TAROM, considerat nerealist de Radu Miruță, amânat la aprobare
Spațiul aerian al aeroportului din Vilnius redeschis, după o alertă cu dronă în Lituania
Spațiul aerian al aeroportului din Vilnius redeschis, după o alertă cu dronă în Lituania