
DALL-E ili njegova posljednja verzija DALL-E 2 svojevrsni je vizualni brat Chat GPT-a, jer je također generativna umjetna inteligencija koju je stvorio OpenAI. Glavna je razlika, naravno, u tome što DALL-E pretvara tekst u slike. Za danas smo pripremili opsežnu recenziju da pokažemo kako funkcionira umjetna inteligencija online.
- Brza izrada, jer može stvoriti sliku za manje od minute
- Kreirao ga je OpenAI, tvrtka koja stoji iza Chat GPT-a
- Slike visoke rezolucije
- Moguće besplatno korištenje
- Autorska prava i pitanja o tome je li program obučen na slikama zaštićenim autorskim pravima
- Iako je Dall-E 2 značajno poboljšao kvalitetu proizvedenih slika, neke slike možda još uvijek neće izgledati dovoljno realistično za neke korisnike.
Za razliku od nekih drugih AI aplikacija koje prave umjetnička dela, ovaj program nije toliko popularan među širom populacijom. Ipak je prema našem skromnom mišljenju jedna od boljih aplikacija umjetna inteligencija koje su se pojavile poslednjih godina.
Što je DALL-E 2?
DALL-E 2 je generativna tehnologija umjetne inteligencije koja korisnicima omogućuje stvaranje novih slika s tekstualnim i grafičkim uputama. Funkcionalno, DALL-E je neuronska mreža i može generirati potpuno nove slike u bilo kojem broju različitih stilova prema korisnikovom unosu. Poput poznatog ChatGPT chatbota, DALL-E je stvorio OpenAI.
DALL-E 2 nasljednik je modela DALL-E koji je počeo s radom u siječnju 2021. Nadimak projekta tvorevina je riječi poznatog španjolskog umjetnika Salvadora Dalíja i Wall-E, popularnog animiranog lika robota stvorenog studija Pixar. U srpnju 2022. model 2 ušao je u beta verziju i bio je dostupan odabranim korisnicima na “White Paper”. 28. rujna 2022. godine. OpenAI je uklonio zahtjev za White Paper, čime je postao beta verzija s otvorenim pristupom koju svatko može koristiti.
Kao i izvorna AI aplikacija, DALL-E 2 je generativni jezični model koji koristi tekstualne upute za generiranje originalnih slika. To je velik model s oko 3,5B parametara, ali ne tako velik kao njegov prethodnik, koji je koristio 12B parametara. Unatoč toj razlici u veličini, DALL-E 2 može proizvesti slike s 4x višom razlučivošću od svoje prve verzije, što je impresivna nadogradnja. Također se čini da je puno bolje prošao s fotorealizmom i brzim razumijevanjem.
DALL-E 2 je jedan od mnogih AI generatora slike na današnjem tržištu. Ako ste zainteresirani za njegovu konkurenciju, možete pročitati našu Midjourney recenziju.
Kako radi DALL-E 2?

Tajni recept iza performansi DALL-E 2 je transformatorska arhitektura. Transformatori su vrsta arhitekture modela koja se koristi u strojnom učenju za obradu sekvencijalnih podataka kao što su rečenice ili podaci vremenskih serija. Posebno dobro razumiju kontekst u kojem se podaci pojavljuju. U DALL-E 2, transformatori se koriste za obradu ulaznog teksta i generiranje niza piksela koji tvore izlaznu sliku. Model koristi strukturu enkoder-dekoder, gdje enkoder obrađuje ulazni tekst, a dekoder proizvodi sliku.
Ova AI aplikacija stoga radi tako da postupno poboljšava sliku iz slučajnog vektora šuma pomoću modela difuzije. Model difuzije trenira se na velikom skupu podataka parova tekst-slika i uči povezivati specifične tekstualne opise s određenim obrascima vrijednosti piksela. Kada korisnik unese tekstualni opis u DALL-E 2, model prvo kodira opis u visokodimenzionalni vektor. Taj se vektor zatim ubacuje u difuzijski model, koji počinje s nasumičnim vektorom šuma i postupno ga poboljšava dok ne proizvede sliku koja odgovara tekstualnom opisu. Model difuzije je probabilistički model, tako da ne stvara uvijek istu sliku za dati tekstualni opis. Ali obično stvara nekoliko različitih verzija, od kojih su sve relativno slične. Korisnik tada može odabrati sliku koja mu se više sviđa.
Kako koristiti DALL-E 2?
Korak 1: Idite na stranicu DALL-E 2 i kliknite na “Prijavi se”. Najlakši način da to učinite je putem Google/Microsoft računa ili putem email adrese. Proces zahtijeva dvofaktornu autentifikaciju, stoga je pametno imati telefon pri ruci.
Međutim, ako već imate OpenAI račun, možete se jednostavno prijaviti s njim.
Korak 2: Kada se proces prijave završi, bit ćete pozdravljeni porukom dobrodošlice. OpenAI će vam ukratko predstaviti što možete učiniti s programom. Kada završite s čitanjem, pritisnite gumb “Nastavi”.
Korak 3: Sada će program ukratko predstaviti svoj kreditni sustav. DALL-E 2 nije potpuno besplatan. Ima sustav “kredita” koji ograničava količinu besplatnog korištenja programa. Korisnici dobivaju 50 besplatnih kredita nakon registracije i 15 besplatnih kredita mjesečno nakon toga.
Korak 4: Pripremite tekstualni opis. Ovo je tekst koji će DALL-E 2 koristiti za stvaranje slike. Opis mora biti jasan i detaljan. Na primjer, umjesto “ptica” možete koristiti “mala ptica sa svijetloplavim perjem i žutim kljunom”. Za opis željenog sadržaja možete koristiti do 400 znakova. Uzmite si vremena i dobro razmislite. Program stvara 4 slike na zahtjev.
Opcija “Iznenadi me”: U ovom slučaju program će automatski stvoriti opis koji će pokazati kako pažljivo sročiti svoje zahtjeve. Također možete prenijeti postojeću sliku i zatražiti od DALL-E 2 da je uredi prema vašim uputama.
Korak 5: Kada pošaljete upit, program DALL-E 2 će generirati nekoliko različitih verzija slike. Možete pregledati izrađene slike i odabrati onu koja vam se najviše sviđa.
Korak 6: Nakon što odaberete sliku, možete je preuzeti klikom na gumb “Preuzmi”. Slika će biti spremljena na zadanu lokaciju za preuzimanje na vašem računalu.
Još nekoliko savjeta za pisanje dobrih upita za DALL-E 2 :
- Budite što precizniji u tekstualnim opisima. Što ste precizniji, veća je vjerojatnost da će DALL-E 2 proizvesti sliku koja ispunjava vaša očekivanja.
- Koristite ključne riječi koje opisuju stil slike koji želite. Na primjer, ako želite fotorealističnu sliku, koristite ključne riječi poput “fotorealistično” ili “realistično”.
- Koristite ključne riječi koje opisuju predmete ili ljude koje želite vidjeti na slici. Na primjer, ako želite vidjeti mačku na slici, koristite ključne riječi poput “mačka” ili “mačić”.
- Eksperimentirajte s različitim tekstualnim opisima i pogledajte kakve slike stvara DALL-E 2.
Primjeri korištenja DALL-E 2
S obzirom na potencijal umjetne inteligencije, DALL-E 2 ima širok raspon primjena. Evo nekoliko:
- Grafički dizajn i ilustracija
Jedna od najizravnijih upotreba DALL-E 2 je u području grafičkog dizajna i ilustracije. Trebate li logo za svoj startup Ili možda ilustracija za blog post? Umjesto da trošite sate tražeći savršenu sliku ili unajmljujući dizajnera, možete jednostavno reći DALL-E 2 što vam treba. To bi moglo revolucionirati industriju dizajna čineći je pristupačnijom i učinkovitijom.
- Stvaranje sadržaja
U svijetu digitalnog marketinga i društvenih medija, sadržaj je kralj. DALL-E 2 ima potencijal promijeniti igru za kreatore sadržaja dopuštajući im stvaranje jedinstvenih slika koje prate svoje postove. Bilo da se radi o prilagođenoj minijaturi za YouTube video ili privlačnoj slici za post na blogu, DALL-E 2 bi mogao uvelike pojednostaviti proces stvaranja sadržaja.
- Obrazovanje i učenje
Film DALL-E 2 također bi mogao biti vrijedan obrazovni alat. Učitelji bi ga mogli koristiti za izradu vizualnih pomagala za podupiranje nastave, čineći apstraktne koncepte opipljivijima i zanimljivijima za učenike.
- Zabava i igre
DALL-E 2 također bi mogao koristiti industriji zabave. Programeri igara mogli bi ga koristiti za stvaranje umjetničkih djela ili čak cijelih okruženja za igre, smanjujući vrijeme i resurse potrebne za razvoj igara. Filmaši bi ga mogli koristiti za stvaranje koncepata ili priča. Uz to, koristeći DALL-E 2, korisnici također mogu kreirati vlastite NFT-ove.
- Personalizirani proizvodi
Zamislite da možete dizajnirati vlastite proizvode jednostavnim opisom. Želite mačku u maski za telefon sa šeširom? Ili majica sa specifičnim dizajnom? Uz DALL-E 2, personalizirani proizvodi mogu postati mnogo dostupniji. Tvrtke bi mogle koristiti DALL-E 2 za ponudu prilagođenih proizvoda koje su dizajnirali sami korisnici.
- Umjetna inteligencija
Umjetnici mogu koristiti DALL-E 2 kao alat u svom kreativnom procesu, stvarajući jedinstvene slike koje će nadahnuti njihova djela. Međutim, umjetnost stvorena umjetnom inteligencijom može se pojaviti kao zaseban žanr.
Povijest

Priča o DALL-E 2 počinje razvojem GPT modela od strane OpenAI-ja. GPT ili Generative Pretrained Transformer niz je velikih jezičnih modela. Najnovija iteracija, GPT-4, sposobna je razumjeti i generirati tekst sličan ljudskom na temelju zadanog odziva. Ovo razmišljanje dovelo je do razvoja ove AI aplikacije, varijante GPT-3 modela koji je bio obučen za generiranje slika iz tekstualnih opisa.
DALL-E je svijetu prikazan u siječnju 2021. godine. Bio je to moćan alat koji je mogao stvoriti realistične slike iz tekstualnih opisa. Međutim, imao je neka ograničenja. Ponekad je, na primjer, mogao stvoriti slike koje nisu bile točne ili realistične. Osim toga, bilo je teško stvoriti slike koje su bile upravo ono što ste željeli, budući da se tekstualni opisi mogu tumačiti na različite načine. Na temelju uspjeha igre prvog modela, OpenAI je poboljšao mogućnosti ovog modela umjetne inteligencije i razvio DALL-E 2, koji je svijetu predstavljen u travnju 2022. godine.
Koliko košta DALL-E?
Kako budete trošili svoje besplatne kredite, morat ćete kupiti više. Krediti koštaju 15 USD za 115 kredita, što je dovoljno za izradu 46 slika. To znači da je cijena oko 0,13 USD po slici.
Postoji li besplatna verzija?
Da, postoji besplatna razina DALL-E 2 koja vam omogućuje izradu do 50 slika mjesečno. Međutim, slike stvorene na besplatnoj razini niže su rezolucije od slika stvorenih na plaćenoj razini.
DALL-E: Prednosti
- Kreativnost na novoj razini: Sposobnost stvaranja jedinstvenih slika na temelju tekstualnih opisa otvara svijet mogućnosti za kreatore i omogućuje im da ostvare svoje ideje na načine koji su prije bili nezamislivi. Bilo da ste grafički dizajner kojem je potrebna inspiracija, kreator sadržaja koji traži savršenu sliku ili učitelj koji traži vizualna pomagala za podučavanje, DALL-E 2 vam može pomoći da oslobodite svoju kreativnost.
- Pojednostavljenje procesa dizajna: Ovaj model može značajno pojednostaviti proces dizajna. Umjesto da troše sate stvarajući sliku od nule ili tražeći savršenu sliku na webu, dizajneri mogu jednostavno opisati što im je potrebno, a DALL-E 2 kreira sliku za njih. To može uštedjeti vrijeme i resurse i povećati učinkovitost procesa dizajna.
- Poboljšanje pristupačnosti: Još jedna prednost projekta je ta što dizajn može učiniti pristupačnijim. Nemaju svi znanje ili resurse za stvaranje slika profesionalne kvalitete. S DALL-E 2, međutim, svatko može stvoriti jedinstvene slike jednostavnim opisom. To bi moglo demokratizirati područje dizajna i omogućiti većem broju ljudi da vizualno izraze svoje ideje.
- Eksperimentiranje: DALL-E 2 također potiče eksperimentiranje. Budući da je stvaranje novih slika tako jednostavno, korisnici mogu eksperimentirati s različitim opisima i parametrima kako bi vidjeli kakve rezultate postižu. To može dovesti do neočekivanih i uzbudljivih otkrića koja pomiču granice onoga što je moguće u umjetnosti i dizajnu.
- Redefiniranje uloge umjetne inteligencije: Možda je jedna od najuzbudljivijih prednosti DALL-E 2 to što može redefinirati ulogu umjetne inteligencije. Tradicionalno se umjetna inteligencija smatra alatom za automatizaciju zadataka ili analizu podataka. DALL-E 2 pokazuje da umjetna inteligencija također može biti alat za kreativnost, koji može stvoriti jedinstvene i uvjerljive slike. To bi moglo dovesti do novih načina razmišljanja i korištenja umjetne inteligencije.
DALL-E: Nedostaci
- Nesigurnost rezultata: Jedan od glavnih izazova DALL-E 2 je nepredvidivost rezultata. Iako može stvoriti impresivne slike na temelju tekstualnih opisa, rezultati su ponekad neočekivani ili nedosljedni. To je zato što je isti, kao i svi modeli umjetne inteligencije, probabilistički, što znači da daje rezultate na temelju vjerojatnosti koje je naučio tijekom obuke. To može dovesti do nedosljednosti i iznenađenja u slikama koje proizvodi.
- Potencijal zloupotrebe : Kao i kod drugih slučajeva generativne umjetne inteligencije, problem s DALL-E 2 je mogućnost zloupotrebe. Budući da je u stanju stvoriti realistične slike iz tekstualnih opisa, postoji rizik da bi se mogao koristiti za stvaranje pogrešnog ili štetnog sadržaja, kao što je deepfake. Na primjer, može se koristiti za izradu lažnih slika za upotrebu u kampanjama dezinformiranja ili za stvaranje neprikladnog sadržaja.
- Utjecaj na kreativne industrije: Dolazak DALL-E 2 također postavlja pitanja o utjecaju na kreativne industrije. Ako umjetna inteligencija može stvarati slike na temelju tekstualnih opisa, što to znači za umjetnike, dizajnere i druge kreativce? DALL-E 2 bi mogao biti vrijedan alat za ove profesionalce, ali bi također mogao obezvrijediti njihov rad ili uzrokovati gubitak posla. DALL-E 2 također pokreće složena pitanja intelektualnog vlasništv . Ako AI stvara sliku, tko je vlasnik autorskih prava? A što se događa ako umjetna inteligencija stvori sliku koja podsjeća na postojeće djelo zaštićeno autorskim pravima? To su pitanja na koja trenutačno nema jasnih odgovora i koja mogu dovesti do pravnih izazova kako upotreba umjetne inteligencije u umjetnosti i dizajnu bude sve raširenija.
DALL-E 2 i Chat GPT: Gdje su glavne razlike?
- Upotreba: DALL-E 2 i Chat GPT imaju različite slučajeve upotrebe zbog različitih funkcionalnosti. DALL-E 2 se može koristiti u područjima kao što su grafički dizajn, stvaranje sadržaja, obrazovanje i zabava gdje je vizualni sadržaj ključan. Međutim, ChatGPT se može koristiti u područjima kao što su korisnička služba, stvaranje sadržaja i virtualna pomoć gdje su tekstualni sadržaj i razgovor važni.
- Obuka: I DALL-E 2 i Chat GPT treniraju se korištenjem velikih baza podataka, ali je priroda tih baza podataka drugačija. DALL-E 2 se obučava na bazi podataka parova tekst-slika, uči razumjeti korelaciju između tekstualnih opisa i odgovarajućih slika. Chat GPT trenira se na skupu tekstualnih podataka, uči predviđati sljedeću riječ u rečenici na temelju konteksta.
- Rezultat: Izlaz DALL-E 2 i Chat GPT također se razlikuje. DALL-E 2 stvara niz piksela koji čine sliku, a Chat GPT stvara niz riječi koje čine tekst.
DALL-E 2 vs. Midjourney: Koji je bolji AI generator slike?
Teško je reći je li Midjourney ili DALL-E 2 bolji, budući da su oba vrlo vješti modeli i reklamirani su kao sljedeća velika stvar. Oboje mogu proizvesti neke impresivne rezultate u području umjetnosti i dizajna. Modelu Midjourney moguće je pristupiti putem Discorda, dok je model DALL-E 2 dostupan samo putem web stranice OpenAI. Na kraju, izbor između dva modela ovisit će o vašim specifičnim preferencijama i proračunu. OpenAI nudi besplatne mjesečne kredite, što znači da korisnici mogu neograničeno besplatno pristupati modelu. Midjourney, s druge strane, nudi samo 25 besplatnih slika prije naplate usluge. Ako još uvijek niste sigurni koji model koristiti, možda bi bilo vrijedno eksperimentirati s oba kako biste vidjeli koji vam se više sviđa.
Odabir boljeg generatora slike zapravo ovisi o vašim potrebama. Ako tražite AI generator slike koji može stvoriti realistične slike iz različitih tekstualnih opisa, DALL-E 2 je dobar izbor. Ali ako tražite AI generator slika koji može stvarati slike u različitim stilovima i interaktivniji je, Midjourney je dobra opcija.
Kad podvučemo crtu
Donedavno je prevladavalo mišljenje da sustavi umjetne inteligencije ne mogu realno nadmašiti ljude u kreativnim poljima. Barem ne u skorije vrijeme. No, DALLE-2 je tu tvrdnju već okrenuo naglavce. Ovo je moćan alat koji može revolucionirati način na koji stvarate slike i komunicirate s njima. Još je u fazi razvoja, ali je već pokazao puno obećanja. U ovom smo članku detaljno pogledali DALL-E 2. Raspravljali smo o njegovim mogućnostima, ograničenjima i mogućim slučajevima upotrebe. Također smo ga usporedili s drugim jezičnim modelima kao što je Chat GPT. Sve u svemu, mislimo da je DALL-E 2 vrijedan alat koji se može koristiti u razne svrhe. Ali kao i svaki moćan alat, i on ima svoje izazove. Nepredvidivost rezultata, mogućnost zlouporabe i složena pitanja intelektualnog vlasništva i etike podsjećaju nas da uz veliku moć dolazi i velika odgovornost.
Podelite naš sadržaj na društvenim mrežama:
Često postavljana pitanja
Što je DALL-E 2?
DALL-E 2 je napredni model umjetne inteligencije koji je razvio OpenAI. To je varijanta GPT-3 modela koji može generirati slike iz tekstualnih opisa.
Kako radi DALL-E 2?
DALL-E 2 koristi kombinaciju transformatorske arhitekture i VQ-VAE-2 (vector Quantized Variational AutoEncoder 2) za obradu ulaznog teksta i generiranje niza piksela koji tvore izlaznu sliku.
Koje su moguće upotrebe DALL-E 2?
DALL-E 2 ima širok raspon mogućih slučajeva upotrebe, uključujući grafički dizajn, stvaranje sadržaja, obrazovanje, zabavu i personalizirane proizvode. Može se koristiti za izradu jedinstvenih slika za razne namjene na temelju tekstualnih opisa.
Koji su nedostaci DALL-E 2?
Iako je DALL-E 2 moćan alat, on također ima neke potencijalne slabosti. To uključuje nepredvidivost rezultata, mogućnost zlouporabe, utjecaj na kreativne industrije, pitanja intelektualnog vlasništva i etička razmatranja.
Mogu li besplatno koristiti DALL-E 2?
Da, možete besplatno koristiti film DALL-E 2. Dobivate 50 besplatnih kredita kada se prijavite, a 15 besplatnih kredita od drugog mjeseca nadalje. Ako vam ponestane besplatnih kredita, također možete kupiti dodatne kredite. U vrijeme pisanja, možete kupiti 115 kredita za 15 USD.