Inteligența generativă transformă analiza marilor seturi de date medicale: studiul care a depășit echipele umane în anumite teste ⋆ AI 24 Știri

Sursa foto: Imagine generată AI iAceastă imagine a fost generată automat de AI pe baza rezumatului articolului și nu reprezintă un moment real fotografiat.

Un experiment realizat de cercetători de la University of California – San Francisco (UCSF) și Wayne State University arată că instrumentele de inteligență artificială generativă pot procesa seturi mari de date medicale mult mai rapid decât echipele tradiționale de informatică și, în unele cazuri, pot obține performanțe egale sau superioare. Rezultatele, publicate în Cell Reports Medicine, ilustrează potențialul acestor sisteme de a scurta considerabil drumul de la date la descoperire științifică.

Un test în lumea reală: obiectivul și importanța sa

Cercetătorii și-au propus să verifice dacă modelele generative pot face față unor sarcini complexe din domeniul sănătății, folosind ca teren de testare studiul despre nașterile premature. Acestea sunt principala cauză a decesului la nou-născuți și contribuie semnificativ la probleme motorii şi cognitive pe termen lung. În Statele Unite, aproximativ 1.000 de copii se nasc prematur în fiecare zi, ceea ce accentuează urgența dezvoltării unor instrumente de diagnostic și prevenție mai rapide și mai exacte.

Metodologia: comparație directă între oameni și AI

Pentru a putea face o comparație clară, echipa a atribuit aceleași sarcini unor grupuri diferite: unele formate exclusiv din experți umani, iar altele alcătuite din cercetători care au lucrat cu instrumente de inteligență generativă. Provocarea principală a fost să se construiască modele predictive pentru nașterea prematură, pornind de la seturi de date reale. Un obiectiv secundar a fost estimarea vârstei gestaționale pe baza analizelor sanguine sau a probelor de placentă.

Datele folosite și complexitatea lor

Echipa condusă de Marina Sirota a compilat date microbiomice de la aproximativ 1.200 de femei însărcinate, rezultate din nouă studii separate, pentru a investiga corelațiile cu nașterea prematură. Colectarea și armonizarea acestor date a necesitat colaborare și partajare deschisă a informațiilor, o practică esențială pentru lucrări de asemenea anverguri. Analiza unui astfel de volum de informații, cu multiple variabile și surse, reprezintă o provocare majoră pentru fluxurile de lucru convenționale din știința datelor.

Experimentul cu inteligență generativă: cum s-a derulat

Cercetătorii au ales opt sisteme de inteligență generativă și le-au cerut, prin instrucțiuni scrise în limbaj natural, să genereze algoritmi pentru analiza acelorași seturi de date utilizate în competiția DREAM (Dialogue on Reverse Engineering Assessment and Methods). Prompturile au fost concepute pentru a ghida modelele în construirea de cod analitic funcțional, asemănător abordărilor folosite de participanții umani din competiție.

Modelele AI au produs cod pe baza instrucțiunilor primite, iar cercetătorii au rulat acel cod pe datele DREAM. Rezultatele au fost mixte: doar patru din cele opt instrumente au generat cod utilizabil care a condus la modele predictive comparabile cu cele dezvoltate de echipe umane; în anumite situații, modelele generate de AI au performat chiar mai bine decât cele construite de experți. Un avantaj clar a fost viteza: sistemele AI au putut scrie cod funcțional în minute, o activitate care, în mod normal, ar fi solicitat programatori cu experiență pentru ore sau zile.

Exemple de rezultate procedurale

Un caz ilustrativ a fost echipa formată din doi cercetători tineri — studentul la masterat de la UCSF Reuben Sarwal și elevul de liceu Victor Tarca — care, folosindu-se de asistența AI, au realizat modele predictive într-un interval scurt. Tinerii cercetători au putut astfel să finalizeze experimentele, să verifice rezultatele și să înainteze manuscrisul pentru publicare în câteva luni, în locul unei perioade mult mai lungi care ar fi fost necesară pentru o echipă convențională fără suportul generativ AI.

Ce a funcționat și ce nu

Nu toate sistemele testate s-au descurcat la fel: jumătate dintre instrumentele analizate nu au produs cod reutilizabil. Aceasta subliniază variabilitatea actuală a capabilităților modelelor generative. Cele care au funcționat au făcut-o fără a necesita echipe numeroase de specialiști pentru a le supraveghea sau corecta, ceea ce indică un potențial de democratizare a accesului la analize avansate de date pentru cercetători cu experiență limitată în știința datelor.

Totuși, autorii subliniază necesitatea unei supravegheri umane atente: modelele generative pot produce rezultate înșelătoare, iar interpretarea corectă a rezultatelor rămâne în mod esențial o responsabilitate umană. AI-ul poate accelera foarte mult etapele de programare și de rulare a analizelor, dar nu înlocuiește judecata științifică privind validitatea, plausibilitatea biologică și interpretarea clinică a descoperirilor.

Contextul competiției DREAM și cronologia lucrărilor

Studiul se leagă de o provocare globală organizată în cadrul DREAM, unde peste 100 de echipe din lume au dezvoltat modele de învățare automată pentru a detecta semne asociate nașterii premature. Majoritatea echipelor au finalizat lucrările în fereastra competițională de trei luni; totuși, consolidarea și publicarea rezultatelor a durat aproape doi ani. Comparativ, efortul bazat pe inteligență generativă — de la inițiere până la depunerea manuscrisului — s-a întins pe aproximativ șase luni, demonstrând o reducere substanțială a timpului total necesar pentru transformarea datelor în rezultate publicabile.

Semnificații pentru practică și cercetare

Accelerarea analizelor poate avea implicații directe pentru dezvoltarea instrumentelor de diagnostic și a cercetării în sănătatea reproductivă. Timpul redus până la obținerea de rezultate permite cercetătorilor să exploreze mai rapid întrebări noi, să repete analize și să valideze ipoteze, ceea ce ar putea grăbi descoperirea de factori de risc și dezvolatrea intervențiilor.

Autorii sugerează că, pe măsură ce instrumentele generative devin mai robuste, cercetătorii cu experiență redusă în știința datelor nu vor mai fi neapărat obligați să formeze colaborări largi sau să aloce zeci sau sute de ore pentru depanarea codului. Acest lucru ar putea modifica modul în care se desfășoară proiectele interdisciplinare, reducând bariera tehnică pentru explorarea unor întrebări biomedicale importante.

Limitele și riscurile identificate

Deși rezultatele sunt promițătoare, autorii avertizează că dependența de generative AI nu este lipsită de riscuri. Modelele pot genera soluții eronate sau pot introduce erori subtile în fluxurile de lucru analitice. Prin urmare, competențele umane în verificare, validare și interpretare rămân esențiale. Echipele de cercetare trebuie să mențină standarde riguroase de control al calității și reproducibilitate atunci când integrează instrumente automate în procesele lor.

Contribuții științifice și autori

Articolul publicat în Cell Reports Medicine are ca autori principali între alții pe Reuben Sarwal, Victor Tarca, Claire A. Dubin, Nikolas Kalavros, Gaurav Bhatti, Sanchita Bhattacharya, Atul Butte, Roberto Romero, Gustavo Stolovitzky, Tomiko T. Oskotsky, Adi L. Tarca și Marina Sirota. Pentru claritate, autorii au fost menționați în paginile studiului astfel:

Reuben Sarwal
Claire Dubin
Sanchita Bhattacharya, MS
Atul Butte, MD, PhD
Victor Tarca (Huron High School, Ann Arbor, MI)
Nikolas Kalavros
Gustavo Stolovitzky, PhD (New York University)
Gaurav Bhatti (Wayne State University)
Roberto Romero, MD, D(Med)Sc (National Institute of Child Health and Human Development (NICHD))

Din cadrul UCSF, Marina Sirota, profesor de Pediatrie și director interimar al Bakar Computational Health Sciences Institute (BCHSI), a fost co-autor senior al studiului și investigatoarea principală a March of Dimes Prematurity Research Center la UCSF. Adi L. Tarca, profesor în Center for Molecular Medicine and Genetics la Wayne State University, a co-seniorat condusul celorlalte două provocări DREAM care au vizat estimarea vârstei gestaționale.

Finanțare și surse de date

Lucrările au fost susținute de March of Dimes Prematurity Research Center la UCSF și de ImmPort. De asemenea, datele utilizate în studiu au fost generate parțial cu sprijinul Pregnancy Research Branch al NICHD.

March of Dimes Prematurity Research Center la UCSF
ImmPort
Pregnancy Research Branch al NICHD

Publicare și referințe

Articolul de referință este intitulat „Benchmarking large language models for predictive modeling in biomedical research with a focus on reproductive health” și a apărut în Cell Reports Medicine, volumul 7 (2), articolul 102594. DOI-ul lucrării este 10.1016/j.xcrm.2026.102594. O relatare a rezultatelor a fost făcută și în comunicatul Universității California – San Francisco, disponibil prin intermediul paginii publicației ScienceDaily.

Autorii subliniază că, deși rezultatele deschid perspective promițătoare, integrarea pe scară largă a inteligenței generative în cercetarea biomedicală trebuie însoțită de proceduri stricte de verificare și de o supraveghere continuă pentru a evita interpretări greșite sau erori ascunse în fluxurile automate de analiză.

Studiul oferă, însă, un exemplu clar despre cum o tehnologie emergentă poate reduce barierele tehnice, poate scurta timpii de cercetare și poate extinde accesul la analize avansate pentru cercetători cu resurse limitate în domeniul științei datelor. Într-un domeniu sensibil și urgent precum sănătatea reproductivă, aceste câștiguri de viteză pot, în perspectivă, contribui la obținerea mai rapidă a instrumentelor care să reducă impactul nașterilor premature.

Tags: Cercetare Medicală, Inteligență Artificială, Sănătate

Inteligența generativă transformă analiza marilor seturi de date medicale: studiul care a depășit echipele umane în anumite teste

Un test în lumea reală: obiectivul și importanța sa

Metodologia: comparație directă între oameni și AI

Datele folosite și complexitatea lor

Experimentul cu inteligență generativă: cum s-a derulat

Exemple de rezultate procedurale

Ce a funcționat și ce nu

Contextul competiției DREAM și cronologia lucrărilor

Semnificații pentru practică și cercetare

Limitele și riscurile identificate

Contribuții științifice și autori

Finanțare și surse de date

Publicare și referințe

Serverele ChatGPT „se topesc” în urma valului de imagini în stil Studio Ghibli

Revoluția ochelarilor inteligenți: ce urmează — Meta, Ray-Ban și dincolo de ele

Internetul sufocat de «AI slop». Cum luptă creatori, cercetători și platforme pentru a reda autenticitatea

Billy Donovan pleacă de la conducerea tehnică a Chicago Bulls după şase sezoane

Soția unui soldat american reținută de ICE la o programare pentru imigrație în El Paso

Judecătorul refuză cererea unui donator neautorizat de spermă care susține că a devenit tatăl a 180 de copii

Carey Mulligan despre conflictul dintre generații în centrul sezonului doi din Beef de la Netflix

Biopicul „Michael” stârnește critici acerbe: între laude pentru muzică și acuzații de cosmetizare a imaginii

Un test în lumea reală: obiectivul și importanța sa

Metodologia: comparație directă între oameni și AI

Datele folosite și complexitatea lor

Experimentul cu inteligență generativă: cum s-a derulat

Exemple de rezultate procedurale

Ce a funcționat și ce nu

Contextul competiției DREAM și cronologia lucrărilor

Semnificații pentru practică și cercetare

Limitele și riscurile identificate

Contribuții științifice și autori

Finanțare și surse de date

Publicare și referințe

Stiri asemenea

In caz ca ai ratat