ChatGPT adaugă generare de imagini și stârnește un val de creații „à la Studio Ghibli”; OpenAI introduce limitări temporare din cauza cererii

OpenAI a integrat generarea de imagini în ChatGPT 4o; popularitatea funcției a forțat compania să impună limitări temporare, iar utilizatorii au creat multe imagini în stil Ghibli.

ChatGPT adaugă generare de imagini și stârnește un val de creații „à la Studio Ghibli”; OpenAI introduce limitări temporare din cauza cererii

Sursa foto: Imagine generată AI iAceastă imagine a fost generată automat de AI pe baza rezumatului articolului și nu reprezintă un moment real fotografiat.


OpenAI a integrat recent generarea de imagini direct în ChatGPT, iar noutatea a declanșat un val imediat de utilizare și discuții în comunitățile creative. Noua funcție, construită pe modelul 4o, a devenit atât de populară încât, potrivit directorului executiv Sam Altman, infrastructura hardware a companiei a fost pusă sub presiune — tweet-ului său menționând în termeni populari că „GPU-urile ne ‘se topesc’” a urmat anunțul unor limitări temporare pentru a tempera fluxul de cereri.

O lansare care a generat cozi virtuale

Lansarea instrumentului de generare a imaginilor în cadrul ChatGPT a fost întâmpinată cu entuziasm, dar și cu o utilizare atât de intensă încât OpenAI a decis să implementeze limitări temporare de acces, cu scopul de a eficientiza serviciul. Sam Altman a explicat că această măsură este provizorie și că echipa lucrează la optimizări care să reducă încărcarea infrastructurii. Totodată, Altman a anunțat că utilizatorii din planul gratuit vor primi în curând un plafon de trei generări de imagini pe zi.

De ce limitări temporare?

Atunci când o funcție care consumă intens resurse este folosită masiv, serverele și procesoarele grafice (GPU) pot lucra la capacitate maximă, ceea ce duce la creșterea energiei consumate, încălzire mai mare și, implicit, timpi de răspuns mai mari. OpenAI a luat măsuri pentru a preveni degradarea calității serviciului, iar modul implementării limitărilor urmărește să ofere o experiență rezonabilă pentru toți utilizatorii, în timp ce se lucrează la soluții de optimizare.

Trendul „Ghibli” și reacțiile publice

În doar câteva ore de la activarea noii funcții, mulți utilizatori au început să creeze imagini inspirate de estetica filmelor Studio Ghibli, cunoscute pentru titluri precum Vecinul meu Totoro și Ponyo. Această tendință a devenit atât de vizibilă încât Sam Altman și-a modificat fotografia de profil pe platforma X într-o versiune „Ghibli-ificată” a propriei imagini.

Totuși, reacțiile din lumea creatorilor rămân tensionate. Un punct de fricțiune este alegerea OpenAI de a permite și chiar de a vedea răspândit un stil asociat vizibil cu un studio al cărui fondator, Hayao Miyazaki, a exprimat anterior o poziție fermă împotriva instrumentelor AI, numindu-le „o insultă la viață însăși”. Acest context a amplificat dezbaterea despre etica utilizării unor stiluri artistice recunoscute și despre drepturile creatorilor în era generativă.

Dall-E rămâne disponibil; ce aduce ChatGPT în plus

Până acum, utilizatorii care doreau să genereze imagini prin instrumentele OpenAI foloseau în principal Dall-E, o aplicație separată specializată în ilustrații și creații vizuale. Dall-E va rămâne disponibil, iar una dintre facilitățile sale apreciate — posibilitatea de a dialoga pentru a edita imaginea — este inclusă și în versiunea de generare de imagini din ChatGPT. Astfel, utilizatorii pot alege între cele două căi, dar acum au la îndemână opțiunea de a crea și edita imagini direct în conversațiile cu ChatGPT.

Accesul la aceste instrumente este permis indiferent de planul folosit, însă caracteristicile și limitele variază: planurile plătite oferă funcții suplimentare și prioritate în procesare, iar abonamentele pornesc, conform informațiilor publicate, de la 20 dolari pe lună. Pentru utilizatorii gratuiti, limitările impuse pe termen scurt pot restrânge frecvența generărilor sau accesul la anumite capacități ale modelului 4o.

Focalizarea pe imagini de lucru și îmbunătățiri tehnice

OpenAI descrie generarea de imagini în ChatGPT 4o ca orientată mai mult spre crearea de materiale utile în contexte profesionale: infografice, diagrame și alte imagini concepute pentru a transmite informații. Un punct cheie promovat de companie este îmbunătățirea randării textului din imagini — o problemă dificilă pentru modelele vizuale, care pot adesea să inventeze cuvinte sau să afişeze text inexact.

Compania a furnizat exemple în care textul generat în imagini este foarte clar. În același timp, OpenAI recunoaște limitările actuale: nu este garantată posibilitatea de a edita cu precizie regiuni specifice dintr-o imagine, iar unele operații de editare pot produce rezultate inconsistente. Aceste provocări sunt legate de natura modelelor de generare și de tendințele lor de a «halucina» detalii sau de a crea anomalii, precum degete în număr greșit.

Probleme cunoscute și evoluția lor

Printre dificultățile identificate de OpenAI se numără:

  • imposibilitatea de a edita exact regiuni specifice dintr-o imagine, o funcție esențială pentru corectarea unor detalii
  • pierderi de modificări între sesiuni de editare, în special la retușarea fețelor
  • probleme de decupare a compoziției
  • dificultăți în generarea corectă a vizualizărilor de date
  • complicații la redarea textului multilingv

OpenAI a declarat că lucrează la remedieri și speră să introducă îmbunătățiri într-un interval scurt, posibil chiar de săptămâna imediat următoare anunțului. Astfel de actualizări ar viza atât acuratețea textului în imagini, cât și stabilitatea editărilor regionării precise.

Transparență: metadata C2PA și politici de conținut

O particularitate a imaginilor generate de OpenAI este lipsa semnelor vizibile sau watermark-urilor care să indice faptul că o imagine a fost creată de un model AI. În schimb, compania afirmă că va include metadata conform standardului C2PA, un format recunoscut în industrie menit să ofere informații în fundal despre proveniența și modul de creare al fișierelor. Această abordare urmărește să păstreze estetica imaginii, dar și să ofere un nivel de trasabilitate pentru cei care doresc să verifice originea conținutului.

În privința siguranței și a utilizării responsabilă, OpenAI spune că regulile de conținut pentru generarea imaginilor vor respecta aceeași politică aplicată modelului 4o. Compania a menționat că a introdus restricții sporite referitoare la nuditate și violență grafică pentru a reduce riscul generării de conținut ofensator sau periculos.

Limitări practice în utilizare și sugestii pentru rezultate mai bune

Deși instrumentul este conceput pentru a facilita creația, există recomandări practice bazate pe primele teste și observații: pentru rezultate mai precise, furnizarea unei surse sau a unui context (de exemplu, un URL către o sursă primară) poate reduce erorile și poate determina modelul să genereze elemente mai corecte. În testele inițiale, menite să verifice fidelitatea răspunsurilor, utilizatorii au observat că modelul se comportă mai bine atunci când i se oferă materiale externe de referință.

Când este utilă versiunea ChatGPT vs. Dall-E

Fiecare instrument are punctele sale forte: Dall-E rămâne apreciat pentru capacitatea sa de creație ilustrativă și pentru fluxul de lucru centrat pe imagini, în timp ce integrarea funcției în ChatGPT aduce avantajul conversării și editării directe în contextul conversațional. Pentru utilizatorii care doresc o experiență completă de chat plus generare și editare rapidă, soluția din ChatGPT poate fi mai convenabilă; pentru cei care preferă o interfață dedicată și poate anumite particularități ale Dall-E, această aplicație rămâne o opțiune solidă.

Cum poți folosi acum generatorul de imagini din ChatGPT

Accesarea noii funcții în interfața ChatGPT este simplă. Pașii principali sunt următorii:

  • Pe pagina principală, faceți clic pe cele trei puncte aflate lângă Search și Deep research. Alegeți opțiunea „Create image”.
  • Pentru a edita, redactați solicitarea dorită în bara de chat și trimiteți-o.
  • Când imaginea este gata și doriți să o salvați, faceți clic pe săgeata în jos din colțul din dreapta sus pentru a descărca fișierul.

Aceste instrucțiuni reflectă fluxul observat la momentul lansării și pot fi modificate pe măsură ce interfața primește îmbunătățiri sau se adaugă funcționalități suplimentare.

Contextul mai larg: tensiuni între creatori și companiile AI

Adoptarea pe scară largă a instrumentelor generative a alimentat un dialog complex între creatori, artiști și dezvoltatorii de inteligență artificială. Pe de o parte, AI oferă noi mijloace de creație și acces la resurse vizuale; pe de altă parte, mulți din rândul creatorilor sunt îngrijorați de modul în care operele lor pot fi folosite pentru antrenarea modelelor sau pentru imitarea stilurilor lor fără consimțământ sau compensații adecvate. Exemplul referitor la imaginile de tip Ghibli pune în lumină această dilemă: popularitatea rapidă a unui stil recunoscut contrastează cu opoziția unor artiști importanți la utilizarea AI în reproducerea sau reinterpretarea creației lor.

Ce urmează?

OpenAI a anunțat că va continua să îmbunătățească atât eficiența, cât și calitatea generării de imagini, lucrând la remedierea problemelor de editare regională și de redare corectă a textului din imagini. Limitările temporare sunt menite să asigure stabilitatea serviciului în timp ce dezvoltatorii optimizează sistemele. În același timp, dezbaterea asupra utilizării stilurilor artistice și a reglementărilor etice rămâne deschisă, iar modul în care industria și creatorii vor ajunge la un consens va modela utilizarea viitoare a acestor instrumente.

Pentru informații suplimentare, anunțul oficial al OpenAI privind generarea de imagini în ChatGPT poate fi consultat aici: Anunț OpenAI despre generarea de imagini 4o. Declarațiile lui Sam Altman despre încărcarea GPU-urilor și limitările introduse au fost făcute publice într-un tweet disponibil aici: Tweet Sam Altman. Pentru un context mai amplu asupra modului în care ChatGPT a evoluat, este utilă și analiza detaliată a ChatGPT 4 realizată de CNET: Recenzie CNET ChatGPT 4.

AI 24 Știri
Prezentare generală a confidențialității

Acest site folosește cookie-uri pentru a-ți putea oferi cea mai bună experiență în utilizare. Informațiile cookie sunt stocate în navigatorul tău și au rolul de a te recunoaște când te întorci pe site-ul nostru și de a ajuta echipa noastră să înțeleagă care sunt secțiunile site-ului pe care le găsești mai interesante și mai utile.