ChatGPT adaugă generare de imagini și îşi „topește” GPU-urile: trend Studio Ghibli și limite temporare pentru utilizatori
OpenAI a integrat generarea de imagini în ChatGPT; funcţia a devenit virală, declanşând limitări temporare şi un trend cu imagini în stil Studio Ghibli.
Sursa foto: Imagine generată AI
OpenAI a introdus recent capacitatea de generare de imagini direct în ChatGPT, o funcţie care a devenit imediat foarte populară şi care a determinat compania să impună restricţii temporare pentru a gestiona volumul mare de solicitări. Anunţul oficial al companiei este disponibil la https://openai.com/index/introducing-4o-image-generation/.
Un val rapid de entuziasm şi un tweet care a atras atenţia
Lansarea funcţiei de generare a imaginilor în ChatGPT a reaprins interesul public pentru creaţiile vizuale realizate cu ajutorul inteligenţei artificiale. Directorul executiv al OpenAI, Sam Altman, a recunoscut pe reţeaua X (fost Twitter) că cererea a fost atât de mare încât a descris situaţia metaforic: „ne topesc GPU-urile”. Mesajul publicat de Altman pe 27 martie 2025 a mai anunţat şi introducerea unor limitări temporare de rată, menite să atenueze presiunea asupra infrastructurii în timp ce echipa lucrează la optimizarea performanţei. Tweet-ul este disponibil la https://twitter.com/sama/status/1905296867145154688?ref_src=twsrc%5Etfw.
Altman a precizat că utilizatorii din planul gratuit vor avea în curând o limită de 3 generaţii de imagini pe zi, măsură menită să împartă accesul între mai mulţi utilizatori în contextul cererii intense.
Tendinţa: imagini în stil Studio Ghibli
În primele ore de la lansare a devenit evident un trend clar: mulţi utilizatori s-au orientat spre generarea de imagini care imită estetica studioului japonez Studio Ghibli, cunoscut pentru filme precum My Neighbor Totoro şi Ponyo, ce au un stil vizual foarte recognoscibil. Chiar şi Altman a adoptat pe scurt o versiune „ghibli-ificată” a fotografiei de profil, demonstrând popularitatea imediată a acestui tip de imagini între publicul folosind noua unelte.
Tensiuni între creatori şi companiile de AI
Pe de altă parte, această alegere de stil a generat şi critici şi ridică din nou problema relaţiei dintre creaţii artistice existente şi tehnologiile de inteligenţă artificială care le reproduc sau le imită. Tensiunile dintre creatori şi firmele de AI au fost evidenţiate în ultimii ani de diferite iniţiative şi apeluri, inclusiv articole şi campanii care ridică semne de întrebare privind utilizarea conţinutului protejat prin drepturi de autor pentru antrenarea modelelor de AI. Un exemplu de discuţie în acest sens este articolul disponibil la https://www.cnet.com/tech/services-and-software/hundreds-of-actors-urge-trump-not-to-let-ai-train-on-their-copyrighted-content/, care ilustrează îngrijorările creatorilor.
De asemenea, jurnalistul Brian Merchant a criticat abordarea OpenAI privind generarea de imagini în stil Ghibli, observând că alegerea de a permite sau de a populariza imitaţii ale unor stiluri foarte recognoscibile ridică probleme etice şi culturale legate de drepturile şi preferinţele creatorilor. Comentariile sale pot fi citite la https://www.bloodinthemachine.com/p/openais-studio-ghibli-meme-factory.
Relaţia cu Dall-E: ce se schimbă pentru utilizatori
Până acum, utilizatorii care doreau să creeze imagini cu ajutorul instrumentelor OpenAI foloseau în principal Dall-E, o aplicaţie separată specializată în generare de imagini. Dall-E a fost apreciat pentru modul său conversaţional unic, care uşurează crearea şi editarea imaginilor. O recenzie dedicată Dall-E poate fi consultată la https://www.cnet.com/tech/services-and-software/openai-dall-e-3-review-generative-ai-for-fanciful-fun-illustrations/, iar un clasament al celor mai bune generatoare AI de imagini este disponibil la https://www.cnet.com/tech/services-and-software/best-ai-image-generators/.
După integrarea generării de imagini în ChatGPT, utilizatorii vor avea opţiunea de a folosi fie Dall-E, fie funcţia din ChatGPT. Potrivit informaţiilor făcute publice, capabilităţile de editare conversaţională care au făcut popular Dall-E sunt incluse şi în versiunea de ChatGPT, astfel încât utilizatorii care preferau fluxul de dialog pentru rafinarea imaginilor vor găsi un comportament similar în noul instrument din ChatGPT.
Acces, planuri şi limitări
Funcţia de generare a imaginilor este disponibilă indiferent de planul ChatGPT folosit — atât utilizatorilor gratuiti, cât şi celor cu plată. În acelaşi timp, OpenAI oferă planuri cu funcţii suplimentare pentru utilizatorii dispuşi să plătească, iar accesul la mai multe resurse şi viteze mai bune poate necesita un abonament. În textul sursei se menţionează explicit că planurile plătite încep de la 20 de dolari pe lună, iar utilizatorii din planul gratuit vor fi limitaţi la 3 generaţii pe zi la un moment dat.
Altman a explicat că limitările introduse temporar sunt menite să protejeze experienţa tuturor utilizatorilor în timp ce OpenAI îşi optimizează infrastructura pentru a face generarea mai eficientă. Implementarea unor limite de rată în primele faze ale lansării unei funcţii cu încărcare mare nu este neobişnuită în industria generării de imagini, iar accesul prioritar sau viteza garantată rămân adesea beneficii ale abonamentelor plătite.
Caracteristicile tehnice şi restricţiile funcţiei de imagini din ChatGPT (4o)
OpenAI a pus accent pe mai multe îmbunătăţiri pentru a face funcţia de generare a imaginilor mai utilă, în special pentru sarcini legate de muncă: crearea de infografice, diagrame şi alte materiale informative. Modelul folosit pentru această funcţie este denumit 4o, iar compania susţine că a îmbunătăţit redarea textului din imagini, un aspect esenţial având în vedere că modelele de AI au tendinţa să „halucineze” sau să greşească textul atunci când îl pun în imagini.
Printre îmbunătăţirile menţionate se numără capacitatea de a produce text mai clar într-o imagine şi posibilitatea de a încărca imagini proprii pentru a le edita cu ajutorul AI. OpenAI a prezentat exemple în care textul din imaginile generate apare mult mai fidel, semnalând un progres faţă de iteraţiile anterioare.
Limite importante ale editării
Compania avertizează asupra unor limitări notabile ale funcţiei. De exemplu, s-ar putea să nu fie posibile modificări precise ale unor regiuni specifice dintr-o imagine, o funcţie esenţială pentru tratarea erorilor frecvente ale modelelor vizuale, cum ar fi reprezentarea incorectă a mâinilor (de exemplu, „mâini cu unsprezece degete”). Dacă utilizatorii încarcă o imagine şi editează ulterior faţa unei persoane sau alte detalii, aceste modificări ar putea fi pierdute între etape successive de editare.
Alte probleme pot include dificultăţi la decupare şi provocări în reprezentarea corectă a vizualizărilor de date sau a textelor multilingve. OpenAI spune că lucrează la aceste aspecte şi speră să furnizeze remedieri în scurt timp, posibil chiar din săptămâna următoare anunţului iniţial.
Metadate şi siguranţă
La nivel de transparenţă, imaginile create în ChatGPT nu vizibile nu vor avea watermark-uri clare care să indice că sunt generate de AI. În schimb, OpenAI a declarat că imaginile vor include metadate conforme standardului C2PA, o practică care permite identificarea în culise a faptului că o imagine a fost produsă de un sistem de inteligenţă artificială. În materie de siguranţă, compania a afirmat că va aplica aceleaşi linii directoare de conţinut precum restul modelului 4o şi că a introdus „restricţii sporite” în special în jurul nuditaţii şi violenţei grafice.
Experienţa utilizatorului: cum se accesează şi se editează imagini în ChatGPT
OpenAI a integrat un flux simplificat pentru a crea şi edita imagini în ChatGPT. Paşii cheie sunt clari şi uşor de urmat:
- Pe pagina principală, faceţi clic pe cele trei puncte situate lângă opţiunile Search şi Deep research, apoi selectaţi Create image.
- Pentru a edita, introduceţi cererea în bara de chat şi trimiteţi-o.
- Când sunteţi mulţumit de rezultat, faceţi clic pe săgeata în jos din colţul din dreapta sus pentru a descărca fişierul.
În testele iniţiale, compania a remarcat că instrumentul are tendinţa de a oferi rezultate mai corecte atunci când i se furnizează o sursă de referinţă, precum un URL către o sursă primară. Această practică poate ajuta modelul să folosească informaţii exacte pentru a genera imagini care conţin texte sau date specifice.
Resurse şi ghiduri recomandate
Persoanele interesate de explorarea mai aprofundată a capacităţilor ChatGPT şi a generării de imagini găsesc utile recenziile şi ghidurile publicate de specialişti. Printre resursele menţionate se numără o recenzie completă a ChatGPT şi un ghid pentru redactarea celor mai bune prompturi pentru imagini AI. Aceste materiale sunt disponibile la:
- https://www.cnet.com/tech/services-and-software/chatgpt-4-review-a-smarter-ai-chatbot-but-itll-cost-you/
- https://www.cnet.com/tech/services-and-software/if-you-want-better-ai-images-you-need-to-use-these-key-ingredients-in-your-prompt/
Aceste articole oferă context suplimentar despre funcţionalităţile disponibile, limitările practice şi sfaturi pentru utilizatorii care doresc să obţină rezultate mai bune din modelele de generare a imaginilor.
Ce rămâne de urmărit
Lansarea integrată a generării de imagini în ChatGPT marchează un nou pas important pentru OpenAI în direcţia transformării chatbotului într-un instrument multimodal capabil să proceseze şi să producă atât text, cât şi imagini. Rămâne de urmărit modul în care compania va gestiona echilibrul dintre accesul larg la noile funcţii şi preocupările legate de proprietate intelectuală, precum şi modul în care vor fi rezolvate problemele tehnice semnalate deja.
Pe termen scurt, utilizatorii vor trebui să se adapteze la limitările temporare impuse pentru a asigura funcţionarea stabilă a serviciului. Pe termen mediu, aşteptările sunt ca optimizările anunţate să reducă constrângerile asupra infrastructurii şi să permită o experienţă mai fluidă, în special pentru cei care folosesc ChatGPT pentru sarcini profesionale precum realizarea de infografice şi diagrame.