Studii de la Brown avertizează: chatboții AI care oferă sfaturi psihoterapeutice încalcă reguli etice esențiale ⋆ AI 24 Știri

Sursa foto: Sciencedaily

Pe măsură ce milioane de oameni apelează la ChatGPT și la alți chatboți bazati pe inteligență artificială pentru sfaturi în stil terapeutic, un studiu condus de cercetători de la Brown University ridică un semnal de alarmă: aceste sisteme, chiar și atunci când li se spune să se comporte ca terapeuți instruiți, încalcă în mod repetat standarde etice fundamentale ale îngrijirii sănătății mintale.

Rezultatele principale ale studiului

Publicat pe 2 martie 2026, studiul arată că modelele lingvistice mari (LLM) folosite drept „consilieri” au manifestat 15 riscuri etice distincte, identificate de o echipă care a colaborat îndeaproape cu profesioniști din domeniul sănătății mintale. În evaluări comparative realizate față în față cu consilieri voluntari cu pregătire și cu psihologi clinicieni autorizați, cercetătorii au descoperit modele repetitive de comportament problematic: gestionarea neadecvată a situațiilor de criză, consolidarea convingerilor dăunătoare, formulări care dau impresia empatiei fără înțelegere reală și răspunsuri părtinitoare.

Un cadru practic orientat pe riscurile etice

Echipa de la Brown, afiliată Centrului pentru Răspundere Tehnologică, Reimaginare și Redesign, a construit un cadru informat de practicieni prin care a cartografiat comportamentul modelelor la încălcarea standardelor etice din practica sănătății mintale. În textul studiului, autorii subliniază necesitatea dezvoltării unor standarde etice, educaționale și juridice pentru consilierii bazati pe modele lingvistice mari, astfel încât aceste standarde să reflecte calitatea și rigoarea îngrijirii cerute în psihoterapia facilitată de oameni.

Cele 15 riscuri etice și gruparea lor

Analiza a identificat 15 riscuri etice distincte, organizate în cinci categorii largi. Cercetătorii au prezentat aceste categorii pentru a ilustra tiparele prin care consilierii automați încalcă standardele profesionale:

Lipsa adaptării contextuale: trec cu vederea povestea unică a persoanei și oferă sfaturi generice.
Colaborare terapeutică deficitară: direcționează conversația prea autoritar și, uneori, consolidează convingeri incorecte sau dăunătoare.
Empatie înșelătoare: folosește expresii precum „Te văd” sau „Te înțeleg” pentru a sugera o conexiune emoțională fără o înțelegere reală.
Discriminare nedreaptă: afișează prejudecăți legate de gen, cultură sau religie.
Lipsa de siguranță și gestionare a crizelor: refuză să abordeze subiecte sensibile, nu direcționează utilizatorii către ajutor adecvat sau răspunde inadecvat în situații de criză, inclusiv în situații cu gânduri suicidare.

Aceste categorii sintetizează tipurile de comportamente problematice observate în interacțiunile simulate între utilizatori și modele.

Cum influențează instrucțiunile (prompturile) comportamentul modelelor

Zainab Iftikhar, doctorandă în informatică la Brown și coordonatoarea studiului, a investigat dacă formularea atentă a instrucțiunilor date modelelor — cunoscute ca prompturi — poate ghida comportamentul acestora astfel încât să fie mai apropiat de standardele etice în context terapeutic. Prompturile sunt instrucțiuni scrise menite să orienteze răspunsul modelului fără a-l reantrena sau fără a-i adăuga date noi.

Iftikhar explică că, prin prompturi, utilizatorii încearcă adesea să determine modelul să adopte un rol terapeutic: de exemplu, „Acționează ca un terapeut cognitiv-comportamental pentru a mă ajuta să reformulez gândurile” sau „Folosește principii din terapia comportamentală dialectică pentru a mă ajuta să înțeleg și să gestionez emoțiile”. Totuși, chiar și când răspunsurile par să urmeze conceptele TCC sau TCD, modelele nu aplică tehnicile terapeutice în sensul uman și se bazează pe tiparele pe care le-au învățat din datele anterioare pentru a genera text care să pară adecvat.

Platforme sociale precum TikTok, Instagram și Reddit au facilitat răspândirea acestor strategii de promptare, iar multe aplicații comerciale de sănătate mintală pentru consumatori folosesc, de fapt, prompturi terapeutice aplicate pe modele generale. Astfel, devine crucial să înțelegem dacă simpla ajustare a prompturilor poate face consilierea AI mai sigură.

Metodologia: testarea chatboților în sesiuni simulate de consiliere

Pentru evaluare, cercetătorii au observat șapte consilieri-pereche (peer counselors) cu experiență în terapie cognitiv-comportamentală, care au efectuat sesiuni de autorconsiliere cu modele instruite prin prompturi să acționeze ca terapeuți TCC. Printre modelele testate s-au numărat versiuni ale seriei GPT de la OpenAI, Claude de la Anthropic și Llama de la Meta.

Ulterior, echipa a selectat conversații simulate bazate pe dialoguri reale de consiliere umană. Trei psihologi clinicieni licențiați au revizuit acele transcrieri pentru a semnala posibile încălcări etice. Această abordare a permis compararea directă între modul în care un om și modul în care modelul răspund la aceleași situații, evidențiind abaterile și limitele comportamentului automat.

Diferența esențială: mecanismele de responsabilizare

Iftikhar a subliniat că terapeuții umani pot greși, dar există mecanisme de supraveghere și organisme de reglementare care pot trasa responsabilități și pot sancționa abaterile profesionale. Când „consilierii” bazati pe modele lingvistice comit aceste încălcări, lipsește un cadru de reglementare stabil și mecanisme clare pentru responsabilizare profesională.

După cum punctează autoarea, absența acestor „mecanisme de responsabilizare” creează o prăpastie: aceleași tipuri de greșeli pot produce consecințe grave pentru utilizatori, dar nu există entități sau proceduri prin care să fie trase la răspundere sistemele sau operatorii lor în același mod în care sunt trași la răspundere terapeuții licențiați.

Rezultate nuanțate: AI nu este exclus din îngrijirea mintală, dar necesită garanții

Cercetătorii subliniază că descoperirile nu elimină posibilitatea ca instrumentele AI să joace un rol în extinderea accesului la servicii de sănătate mintală. Aceste tehnologii ar putea ajuta persoanele care se confruntă cu bariere legate de cost sau disponibilitatea profesioniștilor autorizați. Totuși, studiul atrage atenția asupra necesității unor garanții clare, implementări responsabile și a unor structuri de reglementare solide înainte ca astfel de sisteme să fie folosite în contexte cu miză ridicată.

Iftikhar afirmă că speră ca acest demers să stimuleze prudență: „Dacă discuți cu un chatbot despre sănătatea mintală, există lucruri pe care ar trebui să le urmărești.”

Comentarii externe și importanța evaluării riguroase

Ellie Pavlick, profesoară de informatică la Brown, care nu a fost implicată în cercetare, a apreciat studiul drept o confirmare a necesității examinării atente a sistemelor de AI folosite în domenii sensibile precum sănătatea mintală. Pavlick conduce ARIA, un institut de cercetare în domeniul AI, finanțat de National Science Foundation, axat pe construirea unor asistenți de încredere.

Potrivit ei, realitatea actuală este că este mult mai ușor să construiești și să implementezi sisteme decât să le evaluezi și să le înțelegi pe deplin. Studiul a cerut un efort extins, incluzând experți clinici și o durată de peste un an, pentru a demonstra riscurile identificate. Majoritatea evaluărilor din domeniul AI se bazează pe metrici automate, care, prin natura lor, sunt statice și lipsesc de o componentă umană în buclă.

Pavlick consideră că acest demers poate servi ca model pentru viitoare cercetări care urmăresc îmbunătățirea siguranței în instrumentele AI pentru sănătate mintală. „Există o oportunitate reală pentru AI să contribuie la combaterea crizei de sănătate mintală cu care se confruntă societatea noastră, dar este esențial să depunem efortul necesar pentru a critica și evalua sistemele noastre la fiecare pas pentru a evita să facem mai mult rău decât bine”, a spus ea.

Aspecte tehnice și referințe științifice

Studiul este semnat de Zainab Iftikhar, Amy Xiao, Sean Ransom, Jeff Huang și Harini Suresh, și apare în lucrările conferinței Proceedings of the AAAI/ACM Conference on AI, Ethics, and Society, 2025; volumul 8 (2): 1311. Referința științifică include DOI-ul: http://dx.doi.org/10.1609/aies.v8i2.36632.

Articolul a fost comunicat publicului prin intermediul materialelor furnizate de Brown University și prezentat la conferința AAAI/ACM Conference on Artificial Intelligence, Ethics and Society. Pentru context și acces la comunicarea publică a studiului, materialele asociate au fost disponibile și prin pagina de știri ScienceDaily.

Modelele evaluate

Studiul a inclus teste pe versiuni ale următoarelor modele:

Seria GPT de la OpenAI
Claude de la Anthropic
Llama de la Meta

Participanți umani în studiu

Elementele umane ale evaluării au fost esențiale: echipa a lucrat cu șapte consilieri-pereche antrenați în terapie cognitiv-comportamentală care au condus sesiuni de autorconsiliere cu modelele și a apelat la trei psihologi clinicieni licențiați pentru revizuirea transcrierilor, în scopul identificării potențialelor încălcări etice.

Apel la acțiuni practice și reglementări

Autorii studiului solicită clar dezvoltarea unor standarde etice, educaționale și juridice specifice pentru „consilieri” bazati pe modele lingvistice mari, echivalente cu rigoarea cerută în practica umană a psihoterapiei. Fără astfel de standarde, utilizarea acestor tehnologii în roluri terapeutice riscă să expună utilizatorii la vătămări evitabile sau la recomandări inadecvate.

Studiul recomandă, implicit, o abordare de tip „om în buclă” pentru evaluare și supraveghere, cooperare între experți în AI și practicieni clinici și o atenție sporită asupra modului în care prompturile sunt folosite în aplicații comerciale pentru sănătate mintală.

Pe parcursul investigației, autorii au evidențiat că, deși instrumentele AI pot părea promițătoare pentru extinderea accesului la asistență psihologică, potențialele riscuri etice identificate — 15 la număr și grupate în cele cinci categorii prezentate — necesită controale și reglementări înainte ca aceste sisteme să fie utilizate în contexte sensibile.

Materialele oferite de Brown University și lucrarea publicată în volumul conferinței furnizează baza factuală pentru aceste constatări și pentru apelul la dezvoltarea unor cadre de responsabilitate și protecție pentru utilizatorii care caută sprijin în mediul digital.

Tags: Etică, Inteligență Artificială, Sănătate Mintală

Studii de la Brown avertizează: chatboții AI care oferă sfaturi psihoterapeutice încalcă reguli etice esențiale

Rezultatele principale ale studiului