GPU-urile ChatGPT „se topesc” pe fondul valului de imagini în stil Studio Ghibli
OpenAI a integrat generarea de imagini în ChatGPT; cererea pentru imagini în stil Studio Ghibli a forțat limite temporare ale GPU-urilor și noi restricții pentru utilizatorii gratuiti.
Sursa foto: Cnet
OpenAI a integrat recent generarea de imagini direct în ChatGPT, iar reacția utilizatorilor a fost atât de intensă încât CEO-ul companiei, Sam Altman, a anunțat public că resursele hardware au fost copleșite de cerere. Mesajul transmis de Altman pe platforma X a ridicat semne de întrebare și a adus în discuție atât limitările tehnice ale serviciilor de generare a imaginilor, cât și tensiunile dintre creatorii de conținut și noile instrumente AI.
Un „upgrade” artistic care a generat trafic masiv
Săptămâna aceasta, OpenAI a anunțat lansarea unei funcții care permite crearea de imagini direct în conversațiile ChatGPT, folosind modelul denumit 4o pentru generare de imagini. Noua facilitate a fost primită cu entuziasm de utilizatori, iar în scurt timp cererea a crescut atât de mult încât Altman a scris pe X că „GPU-urile noastre se topesc”. În același mesaj el a explicat că, pentru a gestiona fluxul foarte mare de solicitări, compania va introduce temporar limite de rate în timp ce lucrează pentru a face sistemul mai eficient. Totodată, Altman a anunțat că utilizatorii din planul gratuit ChatGPT vor primi în curând un număr limitat de trei generații pe zi.
Deși afirmația că GPU-urile „se topesc” este metaforică, realitatea tehnică este clară: o creștere bruscă a volumului de solicitări solicită mai multă energie și poate determina hardware-ul să funcționeze la temperaturi mai ridicate, cu efecte asupra performanței și timpilor de răspuns. Pentru a evita blocajele și întârzierile, operatorii de servicii AI recurg frecvent la aplicarea unor limite temporare, o practică familiară utilizatorilor care cunosc deja diferențele între abonamentele gratuite și cele plătite.
Fenomenul „Ghibli-ificat” și tensiunile cu creatorii
În primele ore de la punerea în funcțiune, un trend a dominat galeriile generate de utilizatori: imagini realizate în stilul studioului japonez Ghibli. Filme precum Vecinul meu Totoro și Ponyo au un stil vizual imediat recognoscibil, iar internauții au început să experimenteze cu cereri care reproduc acea estetică. Sam Altman a mers atât de departe încât și-a schimbat poza de profil pe X cu o versiune „Ghibli-ificată” a propriei imagini.
Nu toată lumea a privit însă această tendință cu bunăvoință. Critici și creatori au remarcat că astfel de stilizări pot încălca sensibilitățile artiștilor și pot ridica probleme etice și legale. Brian Merchant, autor la Blood in the Machine, a criticat deschiderea OpenAI către acest fel de meme-uri vizuale, iar figura emblematică a studioului Ghibli, Hayao Miyazaki, a exprimat public o poziție categorică față de utilizarea instrumentelor AI, numindu-le „o insultă adusă vieții însăși”. Tensiunile dintre artiști și companiile AI rămân astfel o parte importantă a discuției publice privind generative AI.
Dall‑E versus ChatGPT: ce s-a schimbat
Până acum, utilizatorii care doreau să creeze imagini cu ajutorul OpenAI apelau la Dall‑E, un program separat conceput special pentru generare vizuală. Dall‑E rămâne disponibil, iar una dintre caracteristicile care l-au făcut popular este modul conversațional prin care utilizatorii pot crea și edita imagini într-un flux interactiv. Această funcționalitate de „chat to edit” este acum inclusă și în versiunea de generare a imaginilor din ChatGPT, ceea ce înseamnă că utilizatorii pot realiza și modifica imagini în aceeași interfață de chat.
Pe planuri practice, atât Dall‑E, cât și noul generator integrat în ChatGPT pot fi folosite indiferent de tipul de abonament, însă limitele impuse de planul curent al utilizatorului se aplică și funcționalității de generare a imaginilor. Astfel, cei care folosesc versiunea gratuită pot întâmpina restricții mai severe, în special când folosesc modelul 4o pentru mesagerie, încărcări de fișiere sau analiză de date. Abonamentele plătite oferă de regulă mai multe generații garantate și timpi de procesare mai rapizi; OpenAI oferă planuri plătite care încep de la 20 de dolari pe lună.
Obiectivele lui ChatGPT 4o: imagini utile pentru muncă
OpenAI a subliniat că modelul 4o nu este orientat doar către imagini artistice, ci și către generarea de imagini utile pentru activități profesionale: infografice, diagrame și alte materiale de comunicare vizuală. Compania spune că a lucrat la îmbunătățirea redării textului din imagini, o zonă în care modelele AI au avut în trecut probleme frecvente, generând text incorect sau „halucinat”. În exemplele oferite de OpenAI, textul din imagini apare remarcabil de clar, ceea ce reprezintă un pas important pentru utilizatorii care creează materiale cu conținut textual integrat.
De asemenea, utilizatorii pot încărca propriile imagini și pot cere modificări asistate de AI. Această funcționalitate extinde posibilitățile de editare și transformare a imaginilor existente, dar compania avertizează că există limitări practice la nivelul preciziei editărilor. În unele cazuri, modificările aplicate unei regiuni specifice a imaginii pot fi mai puțin exacte decât se așteaptă utilizatorul, iar detaliile pot dispărea între iterații succesive ale editării.
Metadate și transparență
Un detaliu important din perspectiva transparenței este că imaginile generate în ChatGPT nu afișează un watermark vizibil care să indice originea AI. În schimb, OpenAI a anunțat că va include metadate C2PA, un standard industrial menit să permită identificarea în fundal a faptului că imaginea a fost creată de un sistem automat. Aceste metadate nu sunt la fel de evidente pentru privitorul obișnuit, dar oferă un mecanism tehnic pentru a demonstra proveniența fișierului.
Limitările curente ale generatorului de imagini
OpenAI avertizează utilizatorii cu privire la mai multe limitări care încă afectează experiența de editare și generare a imaginilor. Printre problemele menționate se numără dificultatea de a edita precis regiuni specifice ale unei imagini și pierderea unor detalii între etape succesive de editare, de exemplu modificările faciale care pot fi eliminate în următoarea iterație. Modelele pot avea, de asemenea, probleme la decupare și la redarea corectă a vizualizărilor de date sau a textului în mai multe limbi.
Compania a recunoscut aceste limitări și a anunțat intenția de a implementa remedieri într-un interval de timp scurt; în comunicările oficiale se menționează speranța introducerii unor corecții „deja săptămâna următoare”. Aceste declarații sugerează că ecosistemul este într-o fază activă de rafinare, în care funcționalitatea este extinsă rapid, dar rămân provocări tehnice de rezolvat.
Reguli de siguranță și conținut
Din punct de vedere al moderării conținutului, OpenAI afirmă că va aplica aceleași reguli ca pentru restul modelului 4o. Compania a menționat că a introdus „restricții sporite” în privința nudului și a violenței grafice, semnalând o orientare preventivă în ceea ce privește materialele sensibile. Aceste măsuri vin în contextul dezbaterilor mai largi despre responsabilitatea companiilor tehnice în gestionarea conținutului generat automat.
Utilizarea practică: pași simpli pentru a crea imagini în ChatGPT
OpenAI a simplificat accesul la generatorul de imagini în cadrul interfeței ChatGPT. Pașii esențiali recomandați pentru a începe sunt intuitivi:
Pe pagina principală, faceți click pe cele trei puncte de lângă căutare și Deep research. Selectați „Create image”.
Pentru a realiza editări, pur și simplu scrieți cererea în bara de chat și trimiteți-o.
Când imaginea este gata și doriți să o salvați, faceți click pe săgeata de jos din dreapta sus pentru a descărca fișierul.
În testele inițiale scurte efectuate de jurnaliști, s-a observat că modelul este mai predispus să furnizeze informații corecte când i se oferă o sursă de referință, cum ar fi un URL către un document primar. Această abordare poate reduce erorile și „halucinațiile” informaționale care pot apărea atunci când AI generează conținut din „imagine” fără context.
Ce rămâne de urmărit
Lansarea generării de imagini direct în ChatGPT marchează un pas major în integrarea capabilităților vizuale în fluxul conversațional AI. În același timp, reacția intensă a publicului a scos la lumină provocările operaționale—capacitatea infrastructurii, modul în care companiile reglementează accesul și limitele creative pe care un model le poate atinge fără a afecta drepturile creatorilor umani.
Pe măsură ce OpenAI implementează ajustările necesare pentru a face sistemul mai eficient și pentru a remedia problemele tehnice identificate, rămâne de văzut cum se vor echilibra cererea populară pentru imagini stilizate și responsabilitatea față de artiști și reguli de conținut. În paralel, discuțiile aprinse despre etica utilizării stilurilor artistice și despre proprietatea intelectuală vor continua să modeleze modul în care astfel de tehnologii sunt folosite în practică.
Pentru mai multe detalii despre anunțul oficial OpenAI și despre comentariile publice ale lui Sam Altman puteți consulta comunicarea oficială a companiei și postarea originală a CEO-ului pe X, iar pentru informații suplimentare despre capacitățile generale ale ChatGPT, există recenzii dedicate care analizează performanța modelului în contexte mai largi.
Anunț OpenAI despre generarea de imagini 4o