ChatGPT primește generare de imagini și declanșează un val de creații în stil Studio Ghibli; OpenAI impune limite temporare

OpenAI a integrat generarea de imagini în ChatGPT, stârnind un val de creații în stil Studio Ghibli și impunând limite temporare din cauza suprasolicitării infrastructurii.

ChatGPT primește generare de imagini și declanșează un val de creații în stil Studio Ghibli; OpenAI impune limite temporare

OpenAI a integrat capabilități de generare de imagini în ChatGPT, o noutate anunțată oficial care a atras rapid un val mare de utilizatori și a obligat compania să introducă măsuri temporare pentru a gestiona traficul. Noua funcție face parte din update-ul modelului 4o și aduce posibilitatea de a crea și edita imagini direct în fereastra de chat, în loc să fie nevoie de un instrument separat. Anunțul companiei a fost însoțit de o creștere atât de mare a cererii încât Sam Altman, CEO OpenAI, a afirmat într-un mesaj public că „GPUs are melting” ca o metaforă menită să sublinieze presiunea exercitată asupra infrastructurii.

Ce a anunțat OpenAI și cum s-a manifestat interesul utilizatorilor

OpenAI a publicat informații despre funcția de generare a imaginilor în cadrul modelului https://openai.com/index/introducing-4o-image-generation/. Noua facilitate le permite utilizatorilor ChatGPT să ceară crearea de imagini, să încarce propriile fișiere pentru editare și să folosească funcționalitățile de editare incluse direct în conversație. Interesul a fost imediat și masiv, astfel încât Sam Altman a postat pe X (fost Twitter) un mesaj în care a menționat problema încărcării infrastructurii, declarând că vor fi introduse limite de rată temporare cât timp echipele lucrează la îmbunătățirea eficienței.

Mesajul public al lui Sam Altman conținea și o precizare referitoare la utilizatorii gratuiti: aceștia vor fi limitați la trei generații de imagini pe zi în curând, deși nu a fost precizat un calendar exact pentru implementarea acestei limitări. Postarea lui Altman poate fi consultată la https://twitter.com/sama/status/1905296867145154688?ref_src=twsrc%5Etfw.

Tendințele emergente: imagini în stil Studio Ghibli

La doar câteva ore după lansarea disponibilă a generatorului de imagini din ChatGPT, a apărut un trend clar: utilizatorii solicitau crearea de imagini care imită stilul estetic asociat studioului japonez Studio Ghibli. Filme precum My Neighbor Totoro și Ponyo sunt date ca exemple ale esteticului distinctiv care a inspirat numeroase solicitări. Chiar și profilul lui Sam Altman pe X a fost schimbat temporar cu o versiune „Ghibli-ied” a sa, semnalând atât popularitatea direcției artistice, cât și capacitatea rapidă a comunității de a experimenta cu noul instrument.

Reacția publicului nu este însă lipsită de controverse. Unele voci din media tehnologică și creatorii de conținut exprimă îngrijorări privind utilizarea stilurilor artistice protejate moral sau cultural, iar în unele cazuri au existat critici directe. De exemplu, Brian Merchant de la Blood in the Machine a atras atenția asupra faptului că este o alegere semnificativă pentru OpenAI să profite de această estetică, cu atât mai mult cu cât Hayao Miyazaki, unul dintre fondatorii Studio Ghibli, și-a exprimat opinii dure față de instrumentele AI, calificându-le drept „o insultă la adresa vieții” în declarații publice.

Ce înseamnă „GPU-urile se topesc” și de ce apar limitele

Afirmația că „GPUs are melting” trebuie înțeleasă ca metaforă pentru gradul foarte mare de solicitare a echipamentelor de calcul specializate pe care serviciile de generare de imagini le utilizează. Generarea de imagini cu ajutorul rețelelor neuronale implică o utilizare intensă a unităților de procesare grafică (GPU), care consumă energie și pot genera căldură pe măsură ce procesele solicitante rulează la capacitate mare. Din acest motiv, la un val brusc de cereri performanța poate scădea, iar timpul de răspuns poate crește. Pentru a controla acest aflux, OpenAI a introdus temporar rate limits, o măsură care urmărește să asigure funcționarea stabilă a serviciului în timp ce echipele lucrează la optimizări.

Compania a comparat indirect această situație cu mecanismele prin care serviciile contra cost pot oferi acces prioritar clienților plătitori: utilizatorii abonați la planuri plătite pot beneficia, în mod obișnuit, de timpi de generare mai rapizi sau de capacitate garantată. În cazul actual, însă, la debut nu au existat diferențe semnificative între „benzi” pentru utilizatorii gratuiti și cei plătiți, ceea ce a determinat presiunea distribuită uniform asupra infrastructurii.

Diferența dintre Dall·E și noua integrare a generării de imagini în ChatGPT

Până acum, utilizatorii interesați de generarea de imagini folosind tehnologiile OpenAI apelau la Dall·E, o aplicație separată care oferă capabilități robuste de creare a ilustrațiilor. Dall·E a fost evaluat în articole de specialitate și este considerat de mulți drept unul dintre cele mai bune generatoare de imagini AI pentru rezultat artistic și flexibilitate. O recenzie dedicată Dall·E poate fi consultată la https://www.cnet.com/tech/services-and-software/openai-dall-e-3-review-generative-ai-for-fanciful-fun-illustrations/, iar un ghid mai larg despre cele mai bune generatoare AI disponibile este disponibil la https://www.cnet.com/tech/services-and-software/best-ai-image-generators/.

Diferența majoră adusă de integrarea în ChatGPT este comoditatea: funcționalitatea de „chat to edit”, asociată anterior cu Dall·E, este acum prezentă direct în fluxul de conversație al ChatGPT. Astfel, utilizatorii pot cere generarea sau modificarea unei imagini în aceeași interfață în care discută cu modelul, ceea ce simplifică procesul creativ și permite feedback interactiv.

Acces, planuri și limitări practice

Modelul ChatGPT este disponibil gratuit, dar există planuri plătite care oferă funcționalități suplimentare, începând de la 20 USD pe lună conform informațiilor din materialele oficiale. Capacitatea de generare a imaginilor depinde de limita impusă planului în care se află utilizatorul: un utilizator gratuit se poate confrunta cu restricții pentru modelul 4o folosit în generarea de imagini, în special pentru mesagerie, încărcări de fișiere și analiză de date. Pentru a gestiona cererea crescută, OpenAI a anunțat că utilizatorii gratuiti vor avea, în curând, o limită de trei generații de imagini pe zi, fără a oferi însă un orizont temporal precis de implementare a acestei reguli.

Acesta este un model cunoscut în lumea serviciilor online: opțiunile plătite oferă, de regulă, avantaje precum timpi de așteptare mai mici sau o capacitate rezervată. În cazul lansării funcției de generare de imagini în ChatGPT, diferențele între nivelurile de acces nu au fost aplicate imediat, ceea ce a condus la o presiune crescută asupra resurselor partajate.

Limitele actuale ale generării de imagini și eforturile de corectare

OpenAI a recunoscut din start unele limitări tehnice care afectează experiența utilizatorilor. În primul rând, editarea precisă a unor regiuni specifice din imagine rămâne complicată: modelele pot avea dificultăți în a modifica doar o porțiune restrânsă fără a altera alte părți ale imaginii, iar rezultatele pot suferi pierderi de detaliu între editări succesive. De exemplu, schimbările aplicate feței unui subiect pot fi pierdute de la o editare la alta, ceea ce face dificilă obținerea unui rezultat consistent pe parcursul unei sesiuni de modificări.

Alte limite menționate includ probleme legate de decupare, dificultăți în generarea corectă a vizualizărilor de date și interpretarea textului multilingv în imagini. O sferă de activitate îmbunătățită vizează redarea textului în imagini — OpenAI a anunțat îmbunătățiri ale randării textului, un aspect esențial pentru generarea de infografice și diagrame, domenii pentru care se dorește o acuratețe sporită. Compania a spus, de asemenea, că lucrează la corecturi care ar putea apărea foarte curând, chiar din săptămâna următoare, conform declarațiilor oficiale.

Exemple furnizate de OpenAI ilustrau capacitatea de a reda clar textele din imagini și un exemplu jucăuș bazat pe un joc de cuvinte legat de melci, arătând atât potențialul creativ, cât și nevoia de rafinare în anumite situații.

Marcajul imaginilor și politicile de siguranță

Imaginile generate cu ajutorul ChatGPT, similar celor create cu Dall·E, nu vor purta un watermark vizibil care să indice public că sunt realizate de un sistem AI. În schimb, OpenAI a declarat că va include metadate conforme cu standardul C2PA, un mecanism din industrie menit să păstreze informații care atestă faptul că un fișier a fost produs prin mijloace automatizate. Aceasta oferă, la nivel tehnic, posibilitatea ca instrumentele de verificare să identifice originea producției media, chiar dacă vizual pentru utilizatorul final nu apare un marcaj direct.

Din perspectiva conținutului, generarea de imagini va respecta aceleași ghiduri de conținut aplicate modelului 4o. OpenAI a menționat existența „restrictii sporite” în jurul nuditații și violenței grafice, ceea ce înseamnă că aceste tipuri de conținut vor fi supuse unor controale mai stricte în procesul de creare prin intermediul modelului.

Ghid practic: cum să creezi și să editezi imagini cu ChatGPT

Pentru utilizatorii care doresc să exploreze noua funcție, procesul este integrat în interfața principală a ChatGPT. Pașii esențiali sunt simpli: pe pagina principală, se poate face click pe cele trei puncte din dreptul opțiunilor Search și Deep research, apoi se selectează „Create image” pentru a începe un proces de generare. Pentru modificări ale unei imagini, utilizatorul introduce solicitarea în bara de chat și o trimite, direcționând astfel modelul să realizeze ajustările dorite. Când rezultatul este gata, imaginea poate fi descărcată prin butonul reprezentat de o săgeată în jos, situat în colțul din dreapta sus al ferestrei imaginii.

În teste inițiale scurte, s-a observat că modelul tinde să furnizeze rezultate mai corecte atunci când i se oferă surse sau contexte clare, precum un URL către o sursă primară. Prin urmare, pentru cereri care implică informație concretă sau documente, oferirea unui punct de referință poate îmbunătăți precizia generării.

Pentru cititorii interesați de informații detaliate despre ChatGPT și despre felul în care se scriu prompturi eficiente pentru generare de imagini, resurse suplimentare pot fi consultate la recenzia ChatGPT disponibilă la https://www.cnet.com/tech/services-and-software/chatgpt-4-review-a-smarter-ai-chatbot-but-itll-cost-you/ și la ghidul pentru redactarea celor mai bune prompturi pentru imagini AI, accesibil la https://www.cnet.com/tech/services-and-software/if-you-want-better-ai-images-you-need-to-use-these-key-ingredients-in-your-prompt/.

Contextul public al dezbaterii despre AI și creație

Lansarea funcției survine într-un moment în care tensiunile dintre creatori și firmele de tehnologie care dezvoltă instrumente AI sunt în creștere. Există îngrijorări persistente cu privire la modul în care modelele AI sunt antrenate și la utilizarea materialelor protejate prin drepturi de autor pentru a genera conținut nou. În acest cadru, alegerea utilizatorilor de a reproduce un anumit stil artistic, precum cel al Studio Ghibli, atrage atenția asupra dilemelor etice și legale referitoare la proprietatea intelectuală și la respectul față de expresiile artistice consacrate.

De asemenea, declarațiile unor personalități din lumea filmului și animației, precum cea a lui Hayao Miyazaki, care a criticat dur instrumentele AI, amplifică discuția despre limitele și condițiile acceptabile de utilizare a tehnologiei. Între timp, companiile care dezvoltă astfel de instrumente, printre care OpenAI, încearcă să echilibreze accesul larg la noile funcționalități cu măsuri de siguranță, transparență și respect pentru drepturile creatorilor.

În esență, integrarea generării de imagini în ChatGPT deschide noi posibilități pentru utilizatori—de la crearea de ilustrații jucăușe la generarea de infografice—însă ridică și întrebări despre modul în care aceste instrumente vor fi gestionate în viitorul apropiat pentru a proteja resursele tehnice, drepturile de autor și etica utilizării.

Utilizatorii interesați pot urmări evoluția măsurilor de rate limiting și actualizările tehnice promise de OpenAI, în timp ce experții în domeniu continuă să dezbată implicațiile culturale și juridice ale adoptării pe scară largă a acestor tehnologii.


Sursa foto: Imagine generată AI iAceastă imagine a fost generată automat de AI pe baza rezumatului articolului și nu reprezintă un moment real fotografiat.

AI 24 Știri
Prezentare generală a confidențialității

Acest site folosește cookie-uri pentru a-ți putea oferi cea mai bună experiență în utilizare. Informațiile cookie sunt stocate în navigatorul tău și au rolul de a te recunoaște când te întorci pe site-ul nostru și de a ajuta echipa noastră să înțeleagă care sunt secțiunile site-ului pe care le găsești mai interesante și mai utile.