»

Meta predstavila svoj generator slik z umetno inteligenco

Slo-Tech - Po Midjourneyju, DALL-E 3 in Stable Diffusionu je tu še četrti konkurent iz prve lige. Meta je predstavila svoj generativni model umetne inteligence za slike, ki nosi ime Emu, sicer pa ga najdemo na Imagine Meta. Model so letos že uporabljali v storitvah Facebook in Instagram, sedaj pa je zaživel samostojno, saj je na voljo kot ločena spletna stran. Za dostop pa je še vedno potrebna prijava, za kar potrebujemo profil na Facebooku ali Instagramu ali pa elektronsko pošto. Formalno v vsakem primeru ustvarimo novi Meta račun, a storitev deluje - če le nismo v Sloveniji.

Prvi vtisi so povprečni, pri čemer je letvica visoka. Storitev vsi primerjajo z Midjourneyjem, pa tudi z DALL-E 3, ki ju še ne doseže. Največ težav ima z risanjem človeških figur, kjer se posamezni udi ali deli telesa pogosto izgubijo ali prelijejo. Z obrazi je še težje, a ni pravila. Včasih Meta ustvari odličen izdelek, spet drugič je ta katastrofalno slab. Rezultati so vedno slike v kvadratnem formatu (1:1), ki imajo...

1 komentar

DALL-E 3 je tu

Slo-Tech - OpenAI je predstavil tretjo inkarnacijo svoje generativne inteligence za izdelovanje slik, DALL-E 3. Podobno kot predhodnik tudi ta iz besedilnega poziva (prompt) izriše bolj ali manj realistično sliko, le da je pri tem boljši. Novinec je tudi povezan s ChatGPT-jem, ki omogoča pisanje obširnejših besedilnih pozivov. V praksi to poteka tako, da se lahko "pogovarjamo" s ChatGPT-jem, dokler ne najdemo ustreznega opisa, ki ga nato DALL-E 3 nariše.

Za zdaj je novi DALL-E 3 v predogledni različici, v okviru ChatGPT Plus in ChatGPT Enterprise pa bo na voljo oktobra. Kasneje bodo dostop dobili raziskovalni laboratoriji, odprli pa bodo tudi API. Niso še razkrili, kdaj bo na voljo tudi brezplačna verzija za slehernika. OpenAI dodaja še, da so se posebej posvetili varnosti. Tako DALL-E 3 ne bo risal neprimernih vsebin, prav tako z njim ne bo možno poustvarjati podob resničnih javnih oseb. DALL-E 3 so nastavili tudi tako, da zavrača pozive po risanju v slogu še živečih umetnikov. Še več,...

26 komentarjev

Bing dobil tudi generator slik

Slo-Tech - Microsoft je svoj Bing, ki je minuli teden dobil jezikovni model, nadgradil tudi z vmesnikom za ustvarjanje slik. Bing Image Creator deluje podobno kot DALL-E, saj ga tudi poganja nadgrajena verzija DALL-E, ki jo je razvil OpenAI. Microsoft je bil v omejeno podjetje vložil deset milijard dolarjev, zato sodelovanje ni presenetljivo.

Bing Image Creator je na voljo za uporabnike, ki so se vpisali v čakalno vrsto za Bing Chat in imajo že aktivirano storitev. Ti lahko slike ustvarjajo neposredno v pogovoru, in sicer v kreativnem načinu. Zadostuje, da Bingu povedo, da želijo imeti sliko (draw an image, create a photo), pa jo bo ta ustvaril in umestil v pogovor. Poleg tega pa ga lahko drugi uporabniki preizkusijo v brskalniku Microsoft Edge ali na naslovu bing.com/create. Deluje enako kot ostali generativni modeli, tj. z vpisom ključnih besed (prompt), iz katerih model ustvari sliko. Te so bolj ali manj realistične, še vedno pa trpijo za halucinacijami (poglejte primer slovenske...

9 komentarjev

Midjourney 5 je tu!

Primerjava Midjourney 3, 4 in 5 (od leve proti desni)

Slo-Tech - Izšla je nova verzija algoritma za ustvarjanje fotografij in slik Midjourney, ki je prvikrat ugledal luč sveta pred letom dni. Ta teden so predstavili že peto inačico, ki je dosegla povsem realistično raven. Posvetili so se izrisu kože in obraza, očem, osvetlitvi, odbojem in senčenju. Končni rezultat so ljudje, ki imajo končno pet prstov, ki imajo realistične obrazne poteze in jasne oči. Roke in oči poudarjamo zato, ker so imele vse prejšnje verzije Midjourneyja in tudi konkurence (Stable Diffusion, DALL-E) velike težave na tem področju. Dlani s šestimi ali sedmimi prsti so postale redna šala o nesposobnosti umetne inteligence.

Midjourney 5 teh težav nima več. Za zdaj je na voljo le proti plačilu, medtem ko se bodo morali brezplačni uporabniki zadovoljiti s prejšnjo verzijo. Dostop lahko dobimo na spletni strani in na njihovem Discordu. Avtorji pravijo, da je Midjourney 5 ne le boljši, temveč tudi bolj razgledan. Obvlada več slogov, na vnose (prompt) se odziva bolje, ustvari manj...

2 komentarja

Shutterstock začel prodajati slike umetne inteligence

Slo-Tech - Že oktobra smo poročali, da je Shutterstock sklenil dogovor z OpenAI, da bodo stvaritve njegove umetne inteligence DALL-E 2 vključene v Shutterstockove plačljive zbirke fotografij. Četrtletje pozneje so dogovor udejanjili in od danes je v zbirkah res grafika DALL-E 2. Na voljo je vsem uporabnikom plačljivih zbirk.

Fotografije umetne inteligence bodo zelo jasno predstavljene, zato pomote niso možne. V Shutterstock bo vključeno okno za ustvarjanje fotografij, enako kot deluje DALL-E 2 neposredno na spletni strani OpenAI. Takisto bo vsak poziv vrnil štiri slike, možno pa bo poiskati še dodatne. To se lahko v prihodnosti še spremeni, saj so slike umetne inteligence zelo kontroverzno področje z vidika avtorskih pravic. Generatorji so se učili s pregledovanjem milijard posnetkov, med katerimi so tudi avtorsko zaščiteni. Zaradi tega je v ZDA v teku že nekaj tožb, rezultati pa so negotovi. Konkurent Getty Images je prav zato dejal, da (še?) ne bo vključil slik umetne inteligence v svoje...

19 komentarjev

Shutterstock bo prodajal grafiko umetne inteligence DALL-E

Slo-Tech - Shutterstock je sklenil dogovor z OpenAI, ki je razvil algoritem DALL-E 2 za računalniško ustvarjanje posnetkov iz besedilnega opisa in ki je že mesec dni dostopen vsem, da bodo stvaritve umetne inteligence na voljo v plačljivih galerijah. Poleg vsebin, ki jih izdelajo ljudje, bo DALL-E 2 edini vir vsebin umetne inteligence. Nalaganje drugih vsebin, ki jih ustvari umetna inteligenca, je sicer prepovedano, ker avtorske pravice (še) niso jasno določene. To je legitimen razlog, ki pa seveda koristi tudi partnerstvu z OpenAI. Iz istega razloga Getty Images ne dovoli posnetkov umetne inteligence.

Izvršni direktor Shutterstocka Paul Hennessy je ob tem dejal, da se načini izražanja in ustvarjalnosti nenehno spreminjajo, čemur morajo slediti. Tak primer je tudi generativna tehnologija, ki stoji za DALL-E 2. Izvršni direktor OpenAI Sam Altman je dodal, da so navdušeni nad novim partnerstvom. Uporabniki Shutterstocka bodo namreč lahko nove fotografije generirali neposredno ob iskanju, saj...

9 komentarjev