Inteligența generativă accelerează descoperirile medicale: modele AI egale sau superioare echipelor de cercetare în studiile despre nașterea prematură

Studiu UCSF arată că inteligența artificială generativă poate analiza rapid date medicale complexe și, în unele cazuri, poate egala sau depăși echipele umane în predicția nașterii premature.

Inteligența generativă accelerează descoperirile medicale: modele AI egale sau superioare echipelor de cercetare în studiile despre nașterea prematură

Sursa foto: Sciencedaily


Un studiu recent condus de cercetători de la University of California – San Francisco (UCSF) și Wayne State University arată că sisteme de inteligență artificială generativă pot procesa seturi enorme de date medicale mult mai rapid decât echipele tradiționale de informatică și, în anumite situații, pot oferi predicții la fel de bune sau mai performante. Experimentele au vizat în special capacitatea acestor sisteme de a analiza date legate de sarcină și microbiom pentru a identifica riscurile de naștere prematură și pentru a estima vârsta gestațională.

Un test în condiții reale: comparație directă între echipe umane și instrumente AI

Cercetătorii au comparat în mod direct performanța unor echipe care au folosit doar expertiză umană cu rezultatele obținute de cercetători ajutați de instrumente AI. Provocarea centrală a fost predicția nașterii premature pornind de la date colectate de la un număr mare de gravide: inițial, echipele au lucrat cu date provenind de la mai mult de 1.000 de femei însărcinate, iar echipa condusă de Marina Sirota a compilat date de microbiom de la aproximativ 1.200 de gravide urmărind rezultatele în cadrul a nouă studii distincte.

Avantajul major al tehnologiilor generative a fost viteza cu care acestea au putut produce cod analitic funcțional pornind de la instrucțiuni text scurte, dar foarte precise. Într-un caz ilustrativ, un echipaj format dintr-un student masterand de la UCSF, Reuben Sarwal, și un elev de liceu, Victor Tarca, au reușit, cu sprijinul sistemelor AI, să dezvolte modele predictive care au funcționat în practică. Sistemele AI au generat cod operațional în câteva minute — ceva ce, în mod obișnuit, ar fi cerut programatorilor experimentați ore sau chiar zile pentru a implementa și depana.

Nu toate sistemele testate au performat la același nivel: din opt chatbots folosite în experiment, doar patru au produs cod utilizabil. Cu toate acestea, cele care au reușit au făcut posibilă reducerea dramatică a necesarului de muncă specializată pentru construirea fluxurilor de analiză, iar echipele tinere sau cu experiență limitată în știința datelor au putut astfel să finalizeze experimentele, să verifice rezultatele și să supună un manuscris spre publicare în doar câteva luni.

Importanța cercetării asupra nașterilor premature

Cercetarea vizând nașterea prematură are o miză clinică majoră: nașterea prematură rămâne principala cauză a deceselor neonatale și contribuie semnificativ la tulburările motorii și cognitive pe termen lung la copii. În Statele Unite, aproximativ 1.000 de bebeluși se nasc prematur în fiecare zi, evidențiind urgența dezvoltării unor instrumente de diagnostic și prevenție mai bune.

Deși cauzele nașterii premature nu sunt încă complet înțelese, investigarea factorilor de risc biologici, precum compoziția microbiomului vaginal, poate oferi indicii importante. Pentru a facilita astfel de cercetări, echipa condusă de Marina Sirota a construit un set de date prin combinarea informațiilor din mai multe studii, metodă care a fost posibilă doar datorită schimbului deschis de date și colaborării între multe echipe și instituții.

Provocările analizării unui set de date vast și complexe

Datele de microbiom și cele biomarker pentru sarcină sunt complexe din punct de vedere al dimensiunii și al structurii: ele provin din multiple cohorturi, au formate diferite și necesită preprocesare atentă, armonizare și integrare pentru a putea fi folosite în modele predictive robuste. Într-o inițiativă anterioară, comunitatea globală s-a implicat într-un concurs de crowdsourcing numit DREAM (Dialogue on Reverse Engineering Assessment and Methods), iar mai mult de 100 de echipe din întreaga lume au dezvoltat modele de învățare automată în cadrul provocărilor dedicate sarcinii.

Majoritatea echipelor participante la DREAM au creat modele în intervalul de trei luni al competiției, dar consolidarea rezultatelor și publicarea concluziilor a necesitat aproape doi ani. Această durată subliniază blocajele tradiționale în transformarea rezultatelor analitice în publicații științifice și sugerează potențialul tehnologiilor generative de a accelera procesele.

Experimentul cu modele generative: procedură și obiective

În urma colaborării dintre grupurile de la UCSF și Wayne State University, coordonate în co-autorat de Marina Sirota și Adi L. Tarca, echipa a instruit opt sisteme AI să genereze algoritmi pornind doar de la instrucțiuni în limbaj natural, fără scriere directă de cod uman. Instrucțiunile au fost concepute pentru a ghida sistemele să analizeze datele în moduri comparabile cu cele folosite de participanții la provocările DREAM.

Obiectivele au inclus: analizarea datelor de microbiom vaginal pentru identificarea semnelor asociate cu nașterea prematură și examinarea probelor sanguine sau placentare pentru estimarea vârstei gestaționale. Estimarea corectă a vârstei gestaționale are importanță clinică majoră, deoarece determinarea felului de îngrijire pe parcursul sarcinii depinde de această valoare; estimările inexacte pot complica pregătirea pentru naștere.

Fiecare sistem AI a primit instrucțiuni natural-language atent redactate, asemănătoare celor folosite cu sisteme publice de tip ChatGPT, iar scopul a fost ca modelele generate să fie rulate pe aceleași seturi de date DREAM pentru o comparație directă cu performanțele echipelor umane.

Rezultatele: eficiență, performanță și limite

Dintre cele opt instrumente generative testate, patru au produs cod care a generat modele cu performanță comparabilă cu cea a echipelor umane; în unele cazuri, modelele generate de AI au performat chiar mai bine. Întregul efort bazat pe AI — de la conceperea ideii până la trimiterea manuscrisului pentru publicare — a durat aproximativ șase luni, o reducere semnificativă a timpului comparativ cu calendarul tradițional al proiectelor similare.

Un avantaj relatat de cercetători este faptul că generative AI poate elibera oamenii de o parte importantă a sarcinilor tehnice: construirea pipeline-urilor de analiză. În cuvintele Marinei Sirota, traducere din original: „Aceste instrumente AI ar putea elimina unul dintre cele mai mari blocaje în știința datelor: construirea fluxurilor noastre de analiză.” Sirota subliniază urgența acestei accelerări pentru pacienții care au nevoie imediat de progrese în diagnostic și tratament.

Adi L. Tarca a evidențiat, de asemenea, potențialul de a permite cercetătorilor cu experiență limitată în știința datelor să răspundă eficient la întrebări biomedicale relevante: „Datorită inteligenței generative, cercetătorii cu un background limitat în știința datelor nu vor mai avea întotdeauna nevoie să formeze colaborări ample sau să petreacă ore depănând cod; ei se pot concentra pe a răspunde întrebărilor biomedicale potrivite.”

Totuși, autorii subliniază necesitatea supravegherii umane atente: sistemele AI pot genera rezultate înșelătoare și, prin urmare, expertiza umană rămâne esențială pentru verificarea, interpretarea și punerea în context a rezultatelor obținute automat.

Limitări observate în studiu

Rezultatele nu au fost uniforme pentru toate instrumentele testate: doar jumătate dintre sistemele evaluate au livrat cod funcțional și util. Acest aspect indică variabilitatea calității între modele generative și necesitatea unor proceduri riguroase de validare atunci când se adoptă aceste tehnologii în cercetarea biomedicală.

Implicații pentru viitorul cercetării biomedicale

Accelerarea etapelor tehnice ale analizei datelor poate schimba fundamental modul în care echipele științifice transformă datele brute în descoperiri. Prin reducerea timpului petrecut pentru scrierea și depanarea codului, cercetătorii pot aloca mai mult efort interpretării rezultatelor, formulării unor ipoteze noi și proiectării de experimente care adresează întrebări clinice relevante.

De asemenea, democratizarea accesului la instrumente analitice avansate înseamnă că grupuri fără echipe mari de informatică pot participa mai activ la proiecte interdisciplinare. În același timp, această democratizare impune stabilirea unor standarde clare de supraveghere, control al calității și reproducibilitate pentru a evita adoptarea prematură a unor soluții nevalidate.

Un exemplu concret: reducerea timpului de publicare

Comparativ cu inițiativa DREAM, în care consolidarea rezultatelor și publicarea au durat aproape doi ani, efortul bazat pe AI s-a desfășurat mult mai rapid: de la concepție până la trimiterea manuscrisului a trecut doar aproximativ jumătate de an. Această diferență temporală ilustrează modul în care instrumentele automate pot diminua timpii morți din ciclul cercetării, fără a elimina însă necesitatea controlului științific riguros.

Autori și contribuții

  • Reuben Sarwal
  • Victor Tarca
  • Claire A. Dubin
  • Nikolas Kalavros
  • Gaurav Bhatti
  • Sanchita Bhattacharya
  • Atul Butte
  • Roberto Romero
  • Gustavo Stolovitzky
  • Tomiko T. Oskotsky
  • Adi L. Tarca
  • Marina Sirota

Autorii UCSF menționați explicit includ pe Reuben Sarwal, Claire Dubin, Sanchita Bhattacharya și Atul Butte. Alți autori provin din diverse instituții, inclusiv Wayne State University, New York University și National Institute of Child Health and Human Development.

Finanțare și surse ale datelor

Studiul a beneficiat de finanțare din partea March of Dimes Prematurity Research Center la UCSF și a proiectului ImmPort. O parte din datele utilizate au fost generate cu sprijinul Pregnancy Research Branch al National Institute of Child Health and Human Development (NICHD).

Publicare și referințe

Studiul a fost publicat în Cell Reports Medicine pe 17 februarie 2026, sub titlul „Benchmarking large language models for predictive modeling in biomedical research with a focus on reproductive health.” Referința DOI este disponibilă online iar articolul poate fi consultat pentru detalii metodologice specifice și informații complete despre performanțele fiecărui model generativ testat.

Mai multe informații sunt disponibile la sursa comunicatului: ScienceDaily – Generative AI analyzes medical data faster than human research teams și la referința DOI a publicației: 10.1016/j.xcrm.2026.102594.

Rezultatele obținute punctează un viitor în care instrumentele de inteligență generativă pot servi drept acceleratori în analiza datelor biomedicale, reducând timpul tehnic necesar transformării informațiilor în insight-uri științifice. Rămâne însă esențial ca adoptarea acestor tehnologii să fie însoțită de proceduri stricte de verificare și de implicarea experților pentru a asigura validitatea și utilitatea clinică a modelării automate.

AI 24 Știri
Prezentare generală a confidențialității

Acest site folosește cookie-uri pentru a-ți putea oferi cea mai bună experiență în utilizare. Informațiile cookie sunt stocate în navigatorul tău și au rolul de a te recunoaște când te întorci pe site-ul nostru și de a ajuta echipa noastră să înțeleagă care sunt secțiunile site-ului pe care le găsești mai interesante și mai utile.