Ce este Dall-E: transformarea textului în imagini în 2023

Ce este Dall-E: transformarea textului în imagini în 2023

Conceptul de a vorbi ceva în existență este încruntat cu o tonă de scepticism în anumite cercuri.

scriem adesea lucrurile ca „gândire doritoare” sau „vise de țeavă”.

Dar trebuie să se spună ceva despre puterea manifestării – în special în ceea ce privește tehnologia .

La începutul anului 2021, OpenAI a lansat un nou model de inteligență artificială numit dall-e .

dall-e este o versiune de formare de 12 miliarde de parametri a modelului de transformare GPT-3.

care duce la creșterea diferitelor AI Art Generators , Dall- E a fost considerat „Picasso of AI” de către unii.

În acest articol, voi explora ce este Dall-e, cum funcționează și ce deține viitorul acestei tehnologii .

Să intrăm corect în ea.

& nbsp;

< /div>

Ce este dall -e?

instruit pe o rețea neuronală și capabil să ia subtitrări text ca intrare, Dall-E generează imagini corespunzătoare.

Cu alte cuvinte, acest instrument AI Art transformă textul în imagini.

Aceasta este o realizare semnificativă, deoarece, până acum, modelele de inteligență artificială au avut dificultăți în a înțelege și a genera imagini din descrierile textului .

De la versiuni antropomorfizate ale animalelor și obiectelor până la imagini suprarealiste și creații complet inedite, Dall-E poate genera o mare varietate de imagini.

Un model de limbaj transformator precum GPT-3, Dall-E este instruit pe un set de date mare de text și imagini.

Această pregătire permite algoritmilor și modelelor sale să învețe relațiile dintre cuvinte și concepte și cum să mapeze acele concepte pe reprezentări vizuale.

se poate folosi nume specifice artistului precum Salvador Dali și Pablo Picasso ca intrări de imagine.

Există, de asemenea, opțiunea de a crea artă care seamănă cu ceva direct din Wall-e .

.

indiferent de metoda de intrare pentru generarea de imagini noi, acest instrument AI este cu adevărat remarcabil.

Dall-e AI poate regenera, de asemenea, orice regiune dreptunghiulară sau „cultură” a unei imagini pe care a generat-o deja.

Dacă nu sunteți mulțumit de un anumit aspect al unei imagini existente, puteți cere Dall-e să genereze unul nou.

Când vine vorba de pixeli, dall-e poate genera o rezoluție 1024 × 1024 , care este mai mare decât multe dintre celelalte instrumente disponibile pe piață.

Tehnologie trecută

rețele adversare generative (GAN) obișnuiau să fie cea mai bună metodă pentru crearea de imagini din descrieri textuale.

Cu toate acestea, GAN -urile au mai multe limitări.

În primul rând, necesită o mulțime de date pentru a funcționa corect.

, de asemenea, tind să producă imagini de calitate scăzută și lipsesc detalii .

În timp ce Gan a fost în jur de ceva vreme, mulți cred că lansarea Dall-e a însemnat sfârșitul domniei lui Gan.

dall-e este, de asemenea, mult mai eficient decât GAN-urile, deoarece poate genera imagini realiste mult mai bune, de o calitate mult mai bună și într-o fracțiune din timp.

dall-e mini

Pe lângă modelul complet Dall-E AI, OpenAI a lansat și o versiune în miniatură numită Dall-e Mini.

În ciuda mai multor capabilități, Dall-e mini poate genera în continuare imagini de înaltă calitate .

dall-e Mini by Craiyon.com este mai accesibil pentru cei care nu au acces la cantități mari de resurse de calcul.

Dall-e Mini este, de asemenea, o versiune open-source a predecesorului său și este disponibilă pentru oricine.

< /a> Dall-e Capabilități

dall-e poate modifica mai multe dintre atributele unui obiect.

Acest lucru duce la rezultate unice și interesante, toate bazate pe descrierea textului dat Dall-e.

înseamnă, de asemenea, că această platformă poate controla numărul de ori în care un obiect apare într -o imagine, precum și dimensiunea, forma și culoarea obiectului menționat.

Dall-e este, de asemenea, capabil să creeze imagini care sunt compuse din scene întregi de la zero , nu doar obiecte individuale.

Acest lucru deschide și mai multe posibilități pentru tipul de imagine generat.

dall-e este capabil să deseneze mai multe obiecte, precum și să formeze relații între ele.

Capacitatea de a genera scene complexe este un pas semnificativ înainte în inteligența artificială.

Pe site-ul lor, Dall-E oferă exemplul de „un arici care poartă o pălărie roșie, mănuși galbene, cămașă albastră și pantaloni verzi.”

Cu pălăria având un atribut de culoare specific , nu este suficient ca instrumentul să recunoască și să creeze pălăria menționată, dar trebuie să o poată plasa corect pe capul ariciului.

același lucru se aplică la mănuși, cămașă și pantaloni menționați în descriere.

Aceasta este o realizare semnificativă și deschide calea pentru ca imaginile și mai complexe să fie generate în viitor.

cu acest concept cunoscut sub numele de legare variabilă, Dall-E poate genera imagini care conțin mai multe obiecte și scene.

Având în vedere trei-dimensii

dall-e nu este doar limitat la imagini bidimensionale.

Platforma este, de asemenea, capabilă să genereze modele tridimensionale de obiecte .

Dall-e este, de asemenea, capabil să genereze modele tridimensionale de obiecte din unghiuri diferite.

în timpul diferitelor faze de testare, dezvoltatorii au dorit să atragă capul unui model din mai multe unghiuri și au descoperit că Dall-E ar putea crea un model 3D neted pe care l-ar putea vedea din orice unghi.

credit de imagine: https://openai.com/

Cuvintele nerostite

Cuvintele pe care cineva le folosește pentru a descrie un obiect rar conțin toate informațiile necesare pentru a genera o imagine exactă.

dall-e poate Luați în considerare cuvintele care nu sunt scrise, dar încă implicate .

Acest lucru permite o înțelegere completă a obiectului descris.

De exemplu, dacă cineva ar descrie un copac, s -ar putea să nu menționeze frunzele, umbra sau mediul înconjurător.

Cu toate acestea, Dall-e poate lua în considerare aceste cuvinte nerostite și poate genera o imagine care conține toate aceste elemente .

În timp ce motoarele de redare 3D ar fi capabile să se apropie după mai multe încercări, faptul că nu trebuie să specificați în mod explicit fiecare detaliu este o demonstrație puternică a ceea ce inteligența artificială poate fi capabilă.

credit de imagine: https://openai.com/

Real vs. imaginea

Combinarea lumilor compuse din imagini autentice și cele bazate pe inteligența artificială a Dall-E poate crea câteva rezultate interesante.

Capacitatea de a sintetiza obiecte și scene care arată identice cu lumea reală deschide o gamă cu totul nouă de posibilități pentru ceea ce poate fi creat.

dall-e oferă câteva exemple din această situație:

  • luând calități asociate cu obiecte aleatorii și mutarea lor la animale
  • Realizarea conexiunilor care nu au fost niciodată făcute până acum prin inspirație fără legătură

De exemplu, textul prompt „Un melc cu textura unei harpe”, are ca rezultat o imagine care amestecă lumea reală și imaginația lui Dall-e.

credit de imagine: https://openai.com/

Rezultatul nu este ceva care există în lumea reală, ci poate produce unele rezultate interesante.

cunoștințe geografice

Dall-e pare să aibă o cantitate corectă de cunoștințe despre detalii geografice, repere și comunități .

Luați în considerare un text prompt de genul:

  • O fotografie a mâncării din China

credit de imagine: https://openai.com/

Aceste prompturi permit dall-e să genereze imagini destul de precise, reprezentative pentru realitatea reală.

< /a> dall-e 2

Pe 28 septembrie 2022, Dall-E 2 a fost deschis oficial publicului .

în timp ce anterior, acesta a fost disponibil doar invitație, cu o listă de așteptare a celor interesați, a fost apoi deschisă oricui dorea să exploreze mai multe.

noua versiune a venit cu mai multe caracteristici și îmbunătățiri noi , dintre care cele mai notabile au fost seturile de date de instruire utilizate pentru a antrena inteligența artificială.

în ceea ce privește prețurile, în iulie 2022, OpenAI a început să încarce credite pentru generația de artă pe platforma Dalle-2 după două luni de a fi liber de utilizat.

Pentru a începe, toți utilizatorii primesc un bonus de credit gratuit.

După aceea, li se acordă 15 credite în fiecare lună.

pentru cei care doresc mai mult, pot cumpăra 15 dolari pentru 115 credite, care ar trebui să poată genera până la 450+ imagini Dall-E .

Viitorul

În timp ce tehnologia este încă în zilele sale relativ timpurii, aplicațiile potențiale pentru Dall-e 2 sunt vaste.

în viitor, am putut vedea că Dall-e este folosit pentru a genera ilustrații, proiecte de produse și chiar opere de artă.

Acest generator de imagini AI ar putea crea, de asemenea, imagini fotorealiste pentru filme și jocuri video .

Posibilitățile sunt interminabile.

Ceea ce este sigur este că Dall-E reprezintă un pas semnificativ înainte în inteligența artificială.

Pe măsură ce această tehnologie continuă să se dezvolte, ne putem imagina doar cum ne va schimba lumea.

dall-e va ajuta, de asemenea, cercetătorii să studieze impactul schimbărilor tehnologice asupra societății , cum ar fi inegalitatea economică sau prejudecata în învățarea automată.

În plus, provocările etice care vin cu noua tehnologie vor fi luate în considerare în continuare, asigurându-se că aplicațiile din Dall-E consideră siguranța și responsabilitatea utilizatorilor lor.

Înfășurați.

În ceea ce privește o generație de text la imagine folosind limbajul natural, Dall-E Openai este unul dintre primele modele AI care a condus calea de a arăta cât de bine poate înțelege o mașină complexitățile lumii noastre. < p>

de la crearea de imagini originale până la adoptarea celor existente, creând o ilustrare profesională de înaltă calitate a oricărui lucru pe care îl poți visa și lucrează cu arta digitală pentru a crea noi experiențe, acest sistem AI generează imagini precum un Artist adevărat.

Capacitatea sa de a lua în considerare ideile nerostite, implicite, ca parte a unui context dat și de a crea imagini unice, dar coerente, care nu au fost niciodată văzute până acum este destul de neplăcută.

Aceasta înseamnă că imaginile generate pot fi utilizate pentru orice, de la social media la design de produse, la crearea de lumi noi pentru jocuri video și filme.

marile și companiile majore folosesc acum modele de generare de imagini pentru a crea imagini realiste ale produselor lor pentru marketing și publicitate, ceea ce va crește doar în viitor.

citirea ulterioară pe Adamenfroy.com: Tehnologia AI se găsește acum în multe aspecte ale unei afaceri.

de la utilizarea unui sistem AI pentru a scrie cuvinte , creați cărți, și dezvoltați materiale de marketing, pentru a utiliza instrumente de marketing AI pentru analizarea datelor și segmentarea publicului, Avantajele AI pentru afaceri sunt multe.

generatoare video AI sunt de asemenea folosite pentru a crea materiale video care este realist și de înaltă calitate, iar această tendință va continua doar.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *