ChatGPT adaugă generare de imagini și stârnește un val de creații „à la Studio Ghibli”; OpenAI introduce limitări temporare din cauza cererii ⋆ AI 24 Știri

Sursa foto: Imagine generată AI iAceastă imagine a fost generată automat de AI pe baza rezumatului articolului și nu reprezintă un moment real fotografiat.

OpenAI a integrat recent generarea de imagini direct în ChatGPT, iar noutatea a declanșat un val imediat de utilizare și discuții în comunitățile creative. Noua funcție, construită pe modelul 4o, a devenit atât de populară încât, potrivit directorului executiv Sam Altman, infrastructura hardware a companiei a fost pusă sub presiune — tweet-ului său menționând în termeni populari că „GPU-urile ne ‘se topesc’” a urmat anunțul unor limitări temporare pentru a tempera fluxul de cereri.

O lansare care a generat cozi virtuale

Lansarea instrumentului de generare a imaginilor în cadrul ChatGPT a fost întâmpinată cu entuziasm, dar și cu o utilizare atât de intensă încât OpenAI a decis să implementeze limitări temporare de acces, cu scopul de a eficientiza serviciul. Sam Altman a explicat că această măsură este provizorie și că echipa lucrează la optimizări care să reducă încărcarea infrastructurii. Totodată, Altman a anunțat că utilizatorii din planul gratuit vor primi în curând un plafon de trei generări de imagini pe zi.

De ce limitări temporare?

Atunci când o funcție care consumă intens resurse este folosită masiv, serverele și procesoarele grafice (GPU) pot lucra la capacitate maximă, ceea ce duce la creșterea energiei consumate, încălzire mai mare și, implicit, timpi de răspuns mai mari. OpenAI a luat măsuri pentru a preveni degradarea calității serviciului, iar modul implementării limitărilor urmărește să ofere o experiență rezonabilă pentru toți utilizatorii, în timp ce se lucrează la soluții de optimizare.

Trendul „Ghibli” și reacțiile publice

În doar câteva ore de la activarea noii funcții, mulți utilizatori au început să creeze imagini inspirate de estetica filmelor Studio Ghibli, cunoscute pentru titluri precum Vecinul meu Totoro și Ponyo. Această tendință a devenit atât de vizibilă încât Sam Altman și-a modificat fotografia de profil pe platforma X într-o versiune „Ghibli-ificată” a propriei imagini.

Totuși, reacțiile din lumea creatorilor rămân tensionate. Un punct de fricțiune este alegerea OpenAI de a permite și chiar de a vedea răspândit un stil asociat vizibil cu un studio al cărui fondator, Hayao Miyazaki, a exprimat anterior o poziție fermă împotriva instrumentelor AI, numindu-le „o insultă la viață însăși”. Acest context a amplificat dezbaterea despre etica utilizării unor stiluri artistice recunoscute și despre drepturile creatorilor în era generativă.

Dall-E rămâne disponibil; ce aduce ChatGPT în plus

Până acum, utilizatorii care doreau să genereze imagini prin instrumentele OpenAI foloseau în principal Dall-E, o aplicație separată specializată în ilustrații și creații vizuale. Dall-E va rămâne disponibil, iar una dintre facilitățile sale apreciate — posibilitatea de a dialoga pentru a edita imaginea — este inclusă și în versiunea de generare de imagini din ChatGPT. Astfel, utilizatorii pot alege între cele două căi, dar acum au la îndemână opțiunea de a crea și edita imagini direct în conversațiile cu ChatGPT.

Accesul la aceste instrumente este permis indiferent de planul folosit, însă caracteristicile și limitele variază: planurile plătite oferă funcții suplimentare și prioritate în procesare, iar abonamentele pornesc, conform informațiilor publicate, de la 20 dolari pe lună. Pentru utilizatorii gratuiti, limitările impuse pe termen scurt pot restrânge frecvența generărilor sau accesul la anumite capacități ale modelului 4o.

Focalizarea pe imagini de lucru și îmbunătățiri tehnice

OpenAI descrie generarea de imagini în ChatGPT 4o ca orientată mai mult spre crearea de materiale utile în contexte profesionale: infografice, diagrame și alte imagini concepute pentru a transmite informații. Un punct cheie promovat de companie este îmbunătățirea randării textului din imagini — o problemă dificilă pentru modelele vizuale, care pot adesea să inventeze cuvinte sau să afişeze text inexact.

Compania a furnizat exemple în care textul generat în imagini este foarte clar. În același timp, OpenAI recunoaște limitările actuale: nu este garantată posibilitatea de a edita cu precizie regiuni specifice dintr-o imagine, iar unele operații de editare pot produce rezultate inconsistente. Aceste provocări sunt legate de natura modelelor de generare și de tendințele lor de a «halucina» detalii sau de a crea anomalii, precum degete în număr greșit.

Probleme cunoscute și evoluția lor

Printre dificultățile identificate de OpenAI se numără:

imposibilitatea de a edita exact regiuni specifice dintr-o imagine, o funcție esențială pentru corectarea unor detalii
pierderi de modificări între sesiuni de editare, în special la retușarea fețelor
probleme de decupare a compoziției
dificultăți în generarea corectă a vizualizărilor de date
complicații la redarea textului multilingv

OpenAI a declarat că lucrează la remedieri și speră să introducă îmbunătățiri într-un interval scurt, posibil chiar de săptămâna imediat următoare anunțului. Astfel de actualizări ar viza atât acuratețea textului în imagini, cât și stabilitatea editărilor regionării precise.

Transparență: metadata C2PA și politici de conținut

O particularitate a imaginilor generate de OpenAI este lipsa semnelor vizibile sau watermark-urilor care să indice faptul că o imagine a fost creată de un model AI. În schimb, compania afirmă că va include metadata conform standardului C2PA, un format recunoscut în industrie menit să ofere informații în fundal despre proveniența și modul de creare al fișierelor. Această abordare urmărește să păstreze estetica imaginii, dar și să ofere un nivel de trasabilitate pentru cei care doresc să verifice originea conținutului.

În privința siguranței și a utilizării responsabilă, OpenAI spune că regulile de conținut pentru generarea imaginilor vor respecta aceeași politică aplicată modelului 4o. Compania a menționat că a introdus restricții sporite referitoare la nuditate și violență grafică pentru a reduce riscul generării de conținut ofensator sau periculos.

Limitări practice în utilizare și sugestii pentru rezultate mai bune

Deși instrumentul este conceput pentru a facilita creația, există recomandări practice bazate pe primele teste și observații: pentru rezultate mai precise, furnizarea unei surse sau a unui context (de exemplu, un URL către o sursă primară) poate reduce erorile și poate determina modelul să genereze elemente mai corecte. În testele inițiale, menite să verifice fidelitatea răspunsurilor, utilizatorii au observat că modelul se comportă mai bine atunci când i se oferă materiale externe de referință.

Când este utilă versiunea ChatGPT vs. Dall-E

Fiecare instrument are punctele sale forte: Dall-E rămâne apreciat pentru capacitatea sa de creație ilustrativă și pentru fluxul de lucru centrat pe imagini, în timp ce integrarea funcției în ChatGPT aduce avantajul conversării și editării directe în contextul conversațional. Pentru utilizatorii care doresc o experiență completă de chat plus generare și editare rapidă, soluția din ChatGPT poate fi mai convenabilă; pentru cei care preferă o interfață dedicată și poate anumite particularități ale Dall-E, această aplicație rămâne o opțiune solidă.

Cum poți folosi acum generatorul de imagini din ChatGPT

Accesarea noii funcții în interfața ChatGPT este simplă. Pașii principali sunt următorii:

Pe pagina principală, faceți clic pe cele trei puncte aflate lângă Search și Deep research. Alegeți opțiunea „Create image”.
Pentru a edita, redactați solicitarea dorită în bara de chat și trimiteți-o.
Când imaginea este gata și doriți să o salvați, faceți clic pe săgeata în jos din colțul din dreapta sus pentru a descărca fișierul.

Aceste instrucțiuni reflectă fluxul observat la momentul lansării și pot fi modificate pe măsură ce interfața primește îmbunătățiri sau se adaugă funcționalități suplimentare.

Contextul mai larg: tensiuni între creatori și companiile AI

Adoptarea pe scară largă a instrumentelor generative a alimentat un dialog complex între creatori, artiști și dezvoltatorii de inteligență artificială. Pe de o parte, AI oferă noi mijloace de creație și acces la resurse vizuale; pe de altă parte, mulți din rândul creatorilor sunt îngrijorați de modul în care operele lor pot fi folosite pentru antrenarea modelelor sau pentru imitarea stilurilor lor fără consimțământ sau compensații adecvate. Exemplul referitor la imaginile de tip Ghibli pune în lumină această dilemă: popularitatea rapidă a unui stil recunoscut contrastează cu opoziția unor artiști importanți la utilizarea AI în reproducerea sau reinterpretarea creației lor.

Ce urmează?

OpenAI a anunțat că va continua să îmbunătățească atât eficiența, cât și calitatea generării de imagini, lucrând la remedierea problemelor de editare regională și de redare corectă a textului din imagini. Limitările temporare sunt menite să asigure stabilitatea serviciului în timp ce dezvoltatorii optimizează sistemele. În același timp, dezbaterea asupra utilizării stilurilor artistice și a reglementărilor etice rămâne deschisă, iar modul în care industria și creatorii vor ajunge la un consens va modela utilizarea viitoare a acestor instrumente.

Pentru informații suplimentare, anunțul oficial al OpenAI privind generarea de imagini în ChatGPT poate fi consultat aici: Anunț OpenAI despre generarea de imagini 4o. Declarațiile lui Sam Altman despre încărcarea GPU-urilor și limitările introduse au fost făcute publice într-un tweet disponibil aici: Tweet Sam Altman. Pentru un context mai amplu asupra modului în care ChatGPT a evoluat, este utilă și analiza detaliată a ChatGPT 4 realizată de CNET: Recenzie CNET ChatGPT 4.

Tags: Inteligență Artificială, OpenAI

ChatGPT adaugă generare de imagini și stârnește un val de creații „à la Studio Ghibli”; OpenAI introduce limitări temporare din cauza cererii

O lansare care a generat cozi virtuale

De ce limitări temporare?

Trendul „Ghibli” și reacțiile publice

Dall-E rămâne disponibil; ce aduce ChatGPT în plus

Focalizarea pe imagini de lucru și îmbunătățiri tehnice

Probleme cunoscute și evoluția lor

Transparență: metadata C2PA și politici de conținut

Limitări practice în utilizare și sugestii pentru rezultate mai bune

Când este utilă versiunea ChatGPT vs. Dall-E

Cum poți folosi acum generatorul de imagini din ChatGPT

Contextul mai larg: tensiuni între creatori și companiile AI

Ce urmează?

Serverele ChatGPT „se topesc” în urma valului de imagini în stil Studio Ghibli

Revoluția ochelarilor inteligenți: ce urmează — Meta, Ray-Ban și dincolo de ele

Internetul sufocat de «AI slop». Cum luptă creatori, cercetători și platforme pentru a reda autenticitatea

Billy Donovan pleacă de la conducerea tehnică a Chicago Bulls după şase sezoane

Soția unui soldat american reținută de ICE la o programare pentru imigrație în El Paso

Judecătorul refuză cererea unui donator neautorizat de spermă care susține că a devenit tatăl a 180 de copii

Carey Mulligan despre conflictul dintre generații în centrul sezonului doi din Beef de la Netflix

Biopicul „Michael” stârnește critici acerbe: între laude pentru muzică și acuzații de cosmetizare a imaginii

O lansare care a generat cozi virtuale

De ce limitări temporare?

Trendul „Ghibli” și reacțiile publice

Dall-E rămâne disponibil; ce aduce ChatGPT în plus

Focalizarea pe imagini de lucru și îmbunătățiri tehnice

Probleme cunoscute și evoluția lor

Transparență: metadata C2PA și politici de conținut

Limitări practice în utilizare și sugestii pentru rezultate mai bune

Când este utilă versiunea ChatGPT vs. Dall-E

Cum poți folosi acum generatorul de imagini din ChatGPT

Contextul mai larg: tensiuni între creatori și companiile AI

Ce urmează?

Stiri asemenea

In caz ca ai ratat