»

Midjourney prenovljen v šesto

Slo-Tech - Danes je izšla nova verzija priljubljenega modela za ustvarjanje slik iz besedilnega opisa Midjourney. Istoimensko podjetje izdalo že šesto inkarnacijo priljubljenega orodja, ki jo lahko vključimo v nastavitvah (/settings) ali s stikalom "--v 6" za opisom prizora. Model je za zdaj še v fazi beta, natrenirali pa so ga povsem od začetka in ne predstavlja neposredne nadgradnje petice.

Nova verzija je še izboljšala kakovost slik, ki jih ustvarja. Te so bolj realistične in natančnejše. Končno se je model naučil tudi pisati, saj lahko v slike vstavlja besedilo, ki ima smisel in niso le črkam podobne krace. To je bil eden večjih izzivov in ena večjih pomanjkljivost, saj je DALL-E 3 ta problem že uspel rešiti. Formalno torej šestica prinaša vernejše sledenje opisu, boljšo koherenco, miksanje, boljše povečevanje ločljivosti obstoječih stvaritev (upscaling) in ustvarjanje besedila.

Druga pomembna novost pa je spremenjeni način formuliranja ukazov. Šestica je bistveno bolj občutljiva in...

0 komentarjev

DALL-E 3 je tu

Slo-Tech - OpenAI je predstavil tretjo inkarnacijo svoje generativne inteligence za izdelovanje slik, DALL-E 3. Podobno kot predhodnik tudi ta iz besedilnega poziva (prompt) izriše bolj ali manj realistično sliko, le da je pri tem boljši. Novinec je tudi povezan s ChatGPT-jem, ki omogoča pisanje obširnejših besedilnih pozivov. V praksi to poteka tako, da se lahko "pogovarjamo" s ChatGPT-jem, dokler ne najdemo ustreznega opisa, ki ga nato DALL-E 3 nariše.

Za zdaj je novi DALL-E 3 v predogledni različici, v okviru ChatGPT Plus in ChatGPT Enterprise pa bo na voljo oktobra. Kasneje bodo dostop dobili raziskovalni laboratoriji, odprli pa bodo tudi API. Niso še razkrili, kdaj bo na voljo tudi brezplačna verzija za slehernika. OpenAI dodaja še, da so se posebej posvetili varnosti. Tako DALL-E 3 ne bo risal neprimernih vsebin, prav tako z njim ne bo možno poustvarjati podob resničnih javnih oseb. DALL-E 3 so nastavili tudi tako, da zavrača pozive po risanju v slogu še živečih umetnikov. Še več,...

26 komentarjev

Nove funkcije v Midjourney 5.2

Primerjava z leve: v3, v4, v5, v5.2

Slo-Tech - Program z generativno umetno inteligenco za ustvarjanje slik iz besedilnega opisa Midjourney je minuli teden dobil novo verzijo Midjourney 5.2. Ta prinaša nekaj uporabnih novosti, med katerimi bodo naročniki bržkone najbolj veseli možnosti zoom out, ki deluje podobno kot outpainting v konkurenčnem DALL-E. To uporabniku omogoča, da vzame obstoječo sliko in jo ohrani kot osrednji del nove slike, medtem ko Midjourney doriše okolico.

Druge novosti so takisto koristne. Prenovljeni "estetski sistem" obljublja boljšo kakovost posnetkov. Ukaz "--stylize" določa, kako realistična bo podoba. Odslej bo nova funkcija high variation mode privzeto vključena, s čimer bodo razlike med generacijami podob večje.

Novi model eksplicitno vključimo v nastavitvah (/settings) ali s stikalom "--v 5.2". Ključne kvalitativne razlike so več podrobnosti, boljše barve, ostrejše slike in kompleksne kompozicije. Prav tako naj bi bolje razumel opise in parameter "--stylize". Kdor želi uporabljati stari model,...

11 komentarjev

Midjourney zaradi zlorab onesposobil brezplačno preizkusno verzijo

Umetna slika

Slo-Tech - Splet so minuli teden preplavile fotografije aretacije nekdanjega ameriškega predsednika, ki se seveda ni nikoli zgodila. Nastale so z orodjem Midjourney, ki omogoča ustvarjanje realističnih generativnih fotografij, podobno kot ChatGPT piše besedila in kot DALL-E riše. Čeprav je Midjourney plačljiva storitev, je bila na voljo tudi brezplačna preizkusna možnost, ki je povsem zadostovala za nekaj posnetkov. Ti so bili tako dobri, da so ljudje za kratek čas celo verjeli, da je papež nosil stilsko belo puhovko.

Sedaj je brezplačnih posnetkov konec
. Midjourney, ki stane od 10 dolarjev mesečno dalje, je ukinil prvih 25 brezplačni posnetkov. Ustanovitelj podjetja David Holz je pojasnil, da so zaznali izjemno povpraševanje in pogoste zlorabe. Zanimivo je, da je bil še pred pol leta Midjourney preslab, da bi lahko koga ukanil, dandanes pa so njegovi posnetki viralni. Težavna pa je predvsem njihova kakovost, zaradi katerih je na prvi pogled nemogoče ugotoviti, da so lažni. Seveda podroben...

29 komentarjev

Midjourney 5 je tu!

Primerjava Midjourney 3, 4 in 5 (od leve proti desni)

Slo-Tech - Izšla je nova verzija algoritma za ustvarjanje fotografij in slik Midjourney, ki je prvikrat ugledal luč sveta pred letom dni. Ta teden so predstavili že peto inačico, ki je dosegla povsem realistično raven. Posvetili so se izrisu kože in obraza, očem, osvetlitvi, odbojem in senčenju. Končni rezultat so ljudje, ki imajo končno pet prstov, ki imajo realistične obrazne poteze in jasne oči. Roke in oči poudarjamo zato, ker so imele vse prejšnje verzije Midjourneyja in tudi konkurence (Stable Diffusion, DALL-E) velike težave na tem področju. Dlani s šestimi ali sedmimi prsti so postale redna šala o nesposobnosti umetne inteligence.

Midjourney 5 teh težav nima več. Za zdaj je na voljo le proti plačilu, medtem ko se bodo morali brezplačni uporabniki zadovoljiti s prejšnjo verzijo. Dostop lahko dobimo na spletni strani in na njihovem Discordu. Avtorji pravijo, da je Midjourney 5 ne le boljši, temveč tudi bolj razgledan. Obvlada več slogov, na vnose (prompt) se odziva bolje, ustvari manj...

2 komentarja

Blender dobil vtičnik za Stable Diffusion

Slo-Tech - Blender, popularno brezplačno orodje za 3-D modeliranje, je pravkar dobilo vtičnik za uporabo generativne umetne inteligence Stable Diffusion. To je model, ki omogoča ustvarjanje slikovnih podob iz besednega opisa in predstavlja odprtokodno implementacijo podobnega orodja kot OpenAI DALL-E. Stable Diffusion je že brezplačno na voljo, sedaj pa so ga še neposredno integrirali v Blender. Z njim lahko podobe ustvarjamo bodisi iz besedil bodisi iz obstoječih slik. V teoriji je možno na tak način ustvariti tudi preproste animacije, a so rezultati še precej primitivni.

Uporaba Stability Diffusiona v Blenderju je brezplačna. Za uporabo ne potrebujemo dodatne strojne opreme niti posebnih grafičnih čipov. V najnovejši verziji Blenderja zadostuje povezava do interneta in ključ za uporabo API, ki ga je možno dobiti brezplačno. Nato namestimo vtičnik, si ogledamo vodiče in krenemo.
Rezultati so precej spodobni, a le v dveh dimenzijah. Ustvarjanje tridimenzionalnih struktur z umetno...

11 komentarjev

Kolektivna tožba zoper avtorje umetne inteligence Stable Diffusion

Slo-Tech - Eno izmed ključnih vprašanj, ki jih je zastavila nova tehnologija, bo dobilo odgovor na sodišču. Orodja umetne inteligence za ustvarjanje fotografij (in tudi drugih vsebin) so se učila z analizo milijard obstoječih izdelkov, ki so tudi avtorsko zaščitena. Ali so potemtakem tudi njihovih izdelki v resnici plagiati oziroma povedano drugače, ali se umetna inteligenca lahko uči iz avtorsko zaščitenih del brez soglasja avtorjev? Trije umetniki menijo, da ne, zato so v ZDA vložili kolektivno tožbo zoper Stability AI in Midjourney, ki sta ustvarila orodje Stable Diffusion, in DeviantArt, ki je ustvaril svoj generator DreamUp.

Sarah Andersen, Kelly McKernan in Karla Ortiz trdijo, da so tožniki množično kršili avtorske pravice milijonov umetnikov, ko so svoje izdelke trenirali na petih milijardah slik in posnetkov (baza LAION), ki so jih našli na spletu. To sploh ni prva tovrstna tožba, saj sta Matthew Butterick in odvetniška pisarna Joseph Saveri Law Firm, ki zastopata tožnike, že bila...

45 komentarjev

DALL-E je sedaj prosto na voljo

openai.com - Pri OpenAI so odstranili čakalno vrsto za svoj slikovni algoritem DALL-E, s čimer predvsem odgovarjajo vse srditejši konkurenci, kot je Stable Diffusion.

Algoritemsko generiranje sličic iz teksta je eno najbolj zanimivih področij informacijske tehnologije v letošnjem letu; tako zaradi dih jemajočih podob, ki jih sedaj že na dnevni bazi sproducira množica uporabnikov širom sveta, kakor tudi zares nore hitrosti razvoja. Po tem, ko je družba OpenAI letošnjega aprila pokazala drugo generacijo algoritma DALL-E, namreč ne mine mesec, da ne bi na plano pokukal nov izzivalec, kakšna nova funkcija ali pa bizaren dogodek, kot je zmaga algoritemsko ustvarjene slike na umetniškem natečaju. Medtem ko je bilo še spomladi videti, da se bodo med seboj udarili tehnološki velikani ali vsaj z njihovim denarjem podprte entitete, pa se v zadnjem času v ospredje prebijajo tudi samostojne in odprte rešitve, kot sta Midjourney ter Stable Diffusion. Posebno slednji je zaradi odprtokodne narave v začetku...

28 komentarjev

DALL-E zna sliko nadaljevati izven okvirjev

openai.com - V družbi za razvoj strojnega učenja OpenAI so predstavili novo zmogljivost svojega algoritma za generiranje slik DALL-E: vzorčno podobo zna z nekaj tekstovne pomoči nadaljevati izven prvotnih okvirjev.

Strojno generiranje podob iz tekstovnih navodil je trenutno eno najzanimivejših področij strojnega učenja. Ne zgolj zaradi bliskovitega napredka, saj novi algoritmi v tehnološko tekmo vstopajo skorajda mesečno, temveč tudi zaradi stvarnega učinka v praksi. Rešitve so se namreč že pririnile v dejanske izdelke; tako je TikTok sredi avgusta predstavil samodejno ustvarjanje risanih ozadij, ki se sicer ne more primerjati s slikarijami s čela napredka, a to niti ni namen. Tudi že lahko vidimo učinek na področje likovne umetnosti, saj se algoritmi že aktivno uporabljajo kot orodje, kar sproža vrsto polemik tako glede avtorstva kakor realne umetniške vrednosti slik, ki so bile ustvarjene s strojno pomočjo. Segment je torej sredi zelo aktivnega razvoja - in laboratoriji za strojno pamet so...

12 komentarjev