»

Nove funkcije v Midjourney 5.2

Primerjava z leve: v3, v4, v5, v5.2

Slo-Tech - Program z generativno umetno inteligenco za ustvarjanje slik iz besedilnega opisa Midjourney je minuli teden dobil novo verzijo Midjourney 5.2. Ta prinaša nekaj uporabnih novosti, med katerimi bodo naročniki bržkone najbolj veseli možnosti zoom out, ki deluje podobno kot outpainting v konkurenčnem DALL-E. To uporabniku omogoča, da vzame obstoječo sliko in jo ohrani kot osrednji del nove slike, medtem ko Midjourney doriše okolico.

Druge novosti so takisto koristne. Prenovljeni "estetski sistem" obljublja boljšo kakovost posnetkov. Ukaz "--stylize" določa, kako realistična bo podoba. Odslej bo nova funkcija high variation mode privzeto vključena, s čimer bodo razlike med generacijami podob večje.

Novi model eksplicitno vključimo v nastavitvah (/settings) ali s stikalom "--v 5.2". Ključne kvalitativne razlike so več podrobnosti, boljše barve, ostrejše slike in kompleksne kompozicije. Prav tako naj bi bolje razumel opise in parameter "--stylize". Kdor želi uporabljati stari model,...

11 komentarjev

Midjourney zaradi zlorab onesposobil brezplačno preizkusno verzijo

Umetna slika

Slo-Tech - Splet so minuli teden preplavile fotografije aretacije nekdanjega ameriškega predsednika, ki se seveda ni nikoli zgodila. Nastale so z orodjem Midjourney, ki omogoča ustvarjanje realističnih generativnih fotografij, podobno kot ChatGPT piše besedila in kot DALL-E riše. Čeprav je Midjourney plačljiva storitev, je bila na voljo tudi brezplačna preizkusna možnost, ki je povsem zadostovala za nekaj posnetkov. Ti so bili tako dobri, da so ljudje za kratek čas celo verjeli, da je papež nosil stilsko belo puhovko.

Sedaj je brezplačnih posnetkov konec
. Midjourney, ki stane od 10 dolarjev mesečno dalje, je ukinil prvih 25 brezplačni posnetkov. Ustanovitelj podjetja David Holz je pojasnil, da so zaznali izjemno povpraševanje in pogoste zlorabe. Zanimivo je, da je bil še pred pol leta Midjourney preslab, da bi lahko koga ukanil, dandanes pa so njegovi posnetki viralni. Težavna pa je predvsem njihova kakovost, zaradi katerih je na prvi pogled nemogoče ugotoviti, da so lažni. Seveda podroben...

29 komentarjev

Midjourney 5 je tu!

Primerjava Midjourney 3, 4 in 5 (od leve proti desni)

Slo-Tech - Izšla je nova verzija algoritma za ustvarjanje fotografij in slik Midjourney, ki je prvikrat ugledal luč sveta pred letom dni. Ta teden so predstavili že peto inačico, ki je dosegla povsem realistično raven. Posvetili so se izrisu kože in obraza, očem, osvetlitvi, odbojem in senčenju. Končni rezultat so ljudje, ki imajo končno pet prstov, ki imajo realistične obrazne poteze in jasne oči. Roke in oči poudarjamo zato, ker so imele vse prejšnje verzije Midjourneyja in tudi konkurence (Stable Diffusion, DALL-E) velike težave na tem področju. Dlani s šestimi ali sedmimi prsti so postale redna šala o nesposobnosti umetne inteligence.

Midjourney 5 teh težav nima več. Za zdaj je na voljo le proti plačilu, medtem ko se bodo morali brezplačni uporabniki zadovoljiti s prejšnjo verzijo. Dostop lahko dobimo na spletni strani in na njihovem Discordu. Avtorji pravijo, da je Midjourney 5 ne le boljši, temveč tudi bolj razgledan. Obvlada več slogov, na vnose (prompt) se odziva bolje, ustvari manj...

2 komentarja

Blender dobil vtičnik za Stable Diffusion

Slo-Tech - Blender, popularno brezplačno orodje za 3-D modeliranje, je pravkar dobilo vtičnik za uporabo generativne umetne inteligence Stable Diffusion. To je model, ki omogoča ustvarjanje slikovnih podob iz besednega opisa in predstavlja odprtokodno implementacijo podobnega orodja kot OpenAI DALL-E. Stable Diffusion je že brezplačno na voljo, sedaj pa so ga še neposredno integrirali v Blender. Z njim lahko podobe ustvarjamo bodisi iz besedil bodisi iz obstoječih slik. V teoriji je možno na tak način ustvariti tudi preproste animacije, a so rezultati še precej primitivni.

Uporaba Stability Diffusiona v Blenderju je brezplačna. Za uporabo ne potrebujemo dodatne strojne opreme niti posebnih grafičnih čipov. V najnovejši verziji Blenderja zadostuje povezava do interneta in ključ za uporabo API, ki ga je možno dobiti brezplačno. Nato namestimo vtičnik, si ogledamo vodiče in krenemo.
Rezultati so precej spodobni, a le v dveh dimenzijah. Ustvarjanje tridimenzionalnih struktur z umetno...

11 komentarjev

Kolektivna tožba zoper avtorje umetne inteligence Stable Diffusion

Slo-Tech - Eno izmed ključnih vprašanj, ki jih je zastavila nova tehnologija, bo dobilo odgovor na sodišču. Orodja umetne inteligence za ustvarjanje fotografij (in tudi drugih vsebin) so se učila z analizo milijard obstoječih izdelkov, ki so tudi avtorsko zaščitena. Ali so potemtakem tudi njihovih izdelki v resnici plagiati oziroma povedano drugače, ali se umetna inteligenca lahko uči iz avtorsko zaščitenih del brez soglasja avtorjev? Trije umetniki menijo, da ne, zato so v ZDA vložili kolektivno tožbo zoper Stability AI in Midjourney, ki sta ustvarila orodje Stable Diffusion, in DeviantArt, ki je ustvaril svoj generator DreamUp.

Sarah Andersen, Kelly McKernan in Karla Ortiz trdijo, da so tožniki množično kršili avtorske pravice milijonov umetnikov, ko so svoje izdelke trenirali na petih milijardah slik in posnetkov (baza LAION), ki so jih našli na spletu. To sploh ni prva tovrstna tožba, saj sta Matthew Butterick in odvetniška pisarna Joseph Saveri Law Firm, ki zastopata tožnike, že bila...

45 komentarjev

Na Otoku bodo prepovedali pornografske deepfake

Slo-Tech - Internet ne razočara in vsaka nova tehnologija je prej ali slej uporabljena za izdelavo pornografije. To se seveda dogaja tudi z deepfaki, ki pa omogočajo izdelavo nesporazumne pornografije, torej posnetkov ljudi, ki o tem sploh nič ne vedo. Da ne bi bilo nobenega dvoma o nesprejemljivosti in nezakonitosti tovrstnega početja, v Veliki Britaniji pripravljajo zakonske spremembe, ki bodo med drugim izrecno kriminalizirale pornografski deepfake. Prepovedana bo tudi maščevalna pornografija (revenge porn), fotografiranje žensk z višine navzdol (downblousing), nameščanje skritih kamer za snemanje brez privoljenja, cyberflashing ipd. Za večino teh posnetkov bo kaznivo tudi razširjanje, med drugim za deepfake.

Na Otoku so že leta 2015 sprejeli prvi zakon, ki je želel zajeziti maščevalno pornografije, a je bil pri tem sorazmerno neuspešen, na kar so žrtve in aktivisti opozarjali vrsto let. Leta 2019 so prepovedali še nekaj dodatnih praks, denimo upskirting. Analize so pokazale, da zaščite...

21 komentarjev

Shutterstock bo prodajal grafiko umetne inteligence DALL-E

Slo-Tech - Shutterstock je sklenil dogovor z OpenAI, ki je razvil algoritem DALL-E 2 za računalniško ustvarjanje posnetkov iz besedilnega opisa in ki je že mesec dni dostopen vsem, da bodo stvaritve umetne inteligence na voljo v plačljivih galerijah. Poleg vsebin, ki jih izdelajo ljudje, bo DALL-E 2 edini vir vsebin umetne inteligence. Nalaganje drugih vsebin, ki jih ustvari umetna inteligenca, je sicer prepovedano, ker avtorske pravice (še) niso jasno določene. To je legitimen razlog, ki pa seveda koristi tudi partnerstvu z OpenAI. Iz istega razloga Getty Images ne dovoli posnetkov umetne inteligence.

Izvršni direktor Shutterstocka Paul Hennessy je ob tem dejal, da se načini izražanja in ustvarjalnosti nenehno spreminjajo, čemur morajo slediti. Tak primer je tudi generativna tehnologija, ki stoji za DALL-E 2. Izvršni direktor OpenAI Sam Altman je dodal, da so navdušeni nad novim partnerstvom. Uporabniki Shutterstocka bodo namreč lahko nove fotografije generirali neposredno ob iskanju, saj...

9 komentarjev

DALL-E je sedaj prosto na voljo

openai.com - Pri OpenAI so odstranili čakalno vrsto za svoj slikovni algoritem DALL-E, s čimer predvsem odgovarjajo vse srditejši konkurenci, kot je Stable Diffusion.

Algoritemsko generiranje sličic iz teksta je eno najbolj zanimivih področij informacijske tehnologije v letošnjem letu; tako zaradi dih jemajočih podob, ki jih sedaj že na dnevni bazi sproducira množica uporabnikov širom sveta, kakor tudi zares nore hitrosti razvoja. Po tem, ko je družba OpenAI letošnjega aprila pokazala drugo generacijo algoritma DALL-E, namreč ne mine mesec, da ne bi na plano pokukal nov izzivalec, kakšna nova funkcija ali pa bizaren dogodek, kot je zmaga algoritemsko ustvarjene slike na umetniškem natečaju. Medtem ko je bilo še spomladi videti, da se bodo med seboj udarili tehnološki velikani ali vsaj z njihovim denarjem podprte entitete, pa se v zadnjem času v ospredje prebijajo tudi samostojne in odprte rešitve, kot sta Midjourney ter Stable Diffusion. Posebno slednji je zaradi odprtokodne narave v začetku...

28 komentarjev

DALL-E zna sliko nadaljevati izven okvirjev

openai.com - V družbi za razvoj strojnega učenja OpenAI so predstavili novo zmogljivost svojega algoritma za generiranje slik DALL-E: vzorčno podobo zna z nekaj tekstovne pomoči nadaljevati izven prvotnih okvirjev.

Strojno generiranje podob iz tekstovnih navodil je trenutno eno najzanimivejših področij strojnega učenja. Ne zgolj zaradi bliskovitega napredka, saj novi algoritmi v tehnološko tekmo vstopajo skorajda mesečno, temveč tudi zaradi stvarnega učinka v praksi. Rešitve so se namreč že pririnile v dejanske izdelke; tako je TikTok sredi avgusta predstavil samodejno ustvarjanje risanih ozadij, ki se sicer ne more primerjati s slikarijami s čela napredka, a to niti ni namen. Tudi že lahko vidimo učinek na področje likovne umetnosti, saj se algoritmi že aktivno uporabljajo kot orodje, kar sproža vrsto polemik tako glede avtorstva kakor realne umetniške vrednosti slik, ki so bile ustvarjene s strojno pomočjo. Segment je torej sredi zelo aktivnega razvoja - in laboratoriji za strojno pamet so...

12 komentarjev

Generiranje slik iz teksta postaja tekma

tale korgi ni resničen

vir: Google
Google - Googlov laboratorij za strojno učenje je predstavil algoritem Imagen, za katerega trdijo, da ustvarja še boljše podobe kot OpenAIjev DALL-E 2.

Zadnji krik področja umetne inteligence so bržkone algoritmi za generiranje slik iz tekstovnih opisov, saj znajo ponekod ustvariti hudo markantne rezultate, kot je podoba tujske hobotnice s časopisom v rokah, ki lebdi skozi portal ali jutranje nakupovalne mrzlice v ekspresionističnem slogu. Z idejo so najbolj udarno pričeli v hiši OpenAI, ko so v začetku lanskega leta predstavili algoritem DALL-E, ki je pred poldrugim mesecem prešel v pošteno nadgrajeno drugo generacijo. Zdaj so se gibanju pridružili še v Googlu in predstavili algoritem Imagen. Kot večina tosortnih programov, tudi Imagen uporablja difuzni model, pri čemer zvito najprej ustvari nizkoločljivostno podobo, ki jo nato razteguje skozi več podalgoritmov, prav tako z difuznimi modeli.

Googlovi inženirji trdijo, da zanesljivo proizvaja boljše podobe od DALL-Eja 2 in so v ta namen...

6 komentarjev

OpenAI predstavil drugo generacijo algoritma DALL-E

openai.com - Laboratorij za strojno učenje OpenAI je pokazal algoritem DALL-E 2, za generiranje slik, ki bistveno nadgrajuje predhodnika in ustvarja navdušujoče verodostojne ter podrobne podobe (tudi) astronavtov na konju v rahlem drncu po Luni.

Lanskega januarja so v družbi za raziskovanje strojne inteligence OpenAI presenetili z algoritmom, ki je znal iz tekstovnega navodila presenetljivo dobro ustvariti želeno podobo. DALL-E je sicer res zvečine izrisal majhne sličice, ki so bile obenem značilno razmazane, kakor smo pri umetni pameti še vedno vajeni - toda že samo dejstvo, da je znal računalnik narisati "stol v podobi avokada", je presunil strokovno javnost. Na tej osnovi je področje hitro napredovalo in postreglo z zanimivimi aplikacijami, kot je Dream ali Baidujev algoritem ERNIE-ViLG. Pred dnevi so v OpenAI predstavili naslednika, DALL-E 2. Tudi njegove sposobnosti milo rečeno sezujejo, saj zna med drugim izrisati "plišaste medvedke v podobi norih znanstvenikov" ali "toplo oblečeno mišjo...

19 komentarjev

OpenAI nadgrajuje algoritem GPT-3 s prepoznavanjem slik

New Scientist - V laboratoriju za strojno učenje OpenAI so predstavili dva zanimiva nova algoritma, DALL-E in CLIP, ki gradita na njihovem razvpitem generatorju besedil GPT-3. Z njima zmogljivost prepoznave in ustvarjanja teksta prenašajo še na področje slik, s čimer želijo strojni inteligenci omogočiti več različnih smeri za učenje in povezovanje znanja.

Firma OpenAI je lani navdušila z algoritmom za ustvarjanje teksta GPT-3, ki iz kratkega nastavka napravi občasno kar strašljivo prepričljiva besedila. Toda kolikor so te sorte programi na prvi pogled impresivni, se začno hitro kazati njihove omejitve, ko jih pregledamo natančneje. GPT-3 se pri daljših besedilih izgubi, predvsem pa kaj kmalu postane jasno, da v resnici sploh ne razume, kaj besediči. Prav učenje dejanskega razumevanja ustvarjene vsebine je naslednja pomembna stopnica, na katero bo morala strojna inteligenca stopiti za nove preboje. Izziva so se v OpenAIju lotili tako, da so GPT-3 združili s prepoznavo in ustvarjanjem slikovnih...

1 komentar

OpenAI je ustvaril algoritem, ki si ga ne upa spustiti v divjino

theguardian.com - V laboratoriju za strojno inteligenco OpenAI so napravili algoritem za generiranje besedil, ki je po njihovem mnenju prenevaren, da bi ga v celoti dali v javnost.

Strojni algoritmi danes ne znajo zgolj prepoznavati vzorcev, temveč tudi ustvarjati nove vsebine, na primer slike in obraze. Seveda so še na stopnji, ko pozornega človeka zelo težko pretentajo, saj je večina njihovih stvaritev nepopolna, dostikrat pa naravnost groteskna. Toda očitno prihajamo v čas, ko bo strojna pamet postala tako sposobna, da bodo njene stvaritve težko razločljive od človeških. V družbi OpenAI, za katero stoji Elon Musk, so namreč ustvarili generator tekstovnih besedil, ki ga ne želijo spustiti iz laboratorija. Menijo, da je tako učinkovit, da bi pomenil...

52 komentarjev