»

Midjourney prenovljen v šesto

Slo-Tech - Danes je izšla nova verzija priljubljenega modela za ustvarjanje slik iz besedilnega opisa Midjourney. Istoimensko podjetje izdalo že šesto inkarnacijo priljubljenega orodja, ki jo lahko vključimo v nastavitvah (/settings) ali s stikalom "--v 6" za opisom prizora. Model je za zdaj še v fazi beta, natrenirali pa so ga povsem od začetka in ne predstavlja neposredne nadgradnje petice.

Nova verzija je še izboljšala kakovost slik, ki jih ustvarja. Te so bolj realistične in natančnejše. Končno se je model naučil tudi pisati, saj lahko v slike vstavlja besedilo, ki ima smisel in niso le črkam podobne krace. To je bil eden večjih izzivov in ena večjih pomanjkljivost, saj je DALL-E 3 ta problem že uspel rešiti. Formalno torej šestica prinaša vernejše sledenje opisu, boljšo koherenco, miksanje, boljše povečevanje ločljivosti obstoječih stvaritev (upscaling) in ustvarjanje besedila.

Druga pomembna novost pa je spremenjeni način formuliranja ukazov. Šestica je bistveno bolj občutljiva in...

0 komentarjev

DALL-E 3 je tu

Slo-Tech - OpenAI je predstavil tretjo inkarnacijo svoje generativne inteligence za izdelovanje slik, DALL-E 3. Podobno kot predhodnik tudi ta iz besedilnega poziva (prompt) izriše bolj ali manj realistično sliko, le da je pri tem boljši. Novinec je tudi povezan s ChatGPT-jem, ki omogoča pisanje obširnejših besedilnih pozivov. V praksi to poteka tako, da se lahko "pogovarjamo" s ChatGPT-jem, dokler ne najdemo ustreznega opisa, ki ga nato DALL-E 3 nariše.

Za zdaj je novi DALL-E 3 v predogledni različici, v okviru ChatGPT Plus in ChatGPT Enterprise pa bo na voljo oktobra. Kasneje bodo dostop dobili raziskovalni laboratoriji, odprli pa bodo tudi API. Niso še razkrili, kdaj bo na voljo tudi brezplačna verzija za slehernika. OpenAI dodaja še, da so se posebej posvetili varnosti. Tako DALL-E 3 ne bo risal neprimernih vsebin, prav tako z njim ne bo možno poustvarjati podob resničnih javnih oseb. DALL-E 3 so nastavili tudi tako, da zavrača pozive po risanju v slogu še živečih umetnikov. Še več,...

26 komentarjev

Nove funkcije v Midjourney 5.2

Primerjava z leve: v3, v4, v5, v5.2

Slo-Tech - Program z generativno umetno inteligenco za ustvarjanje slik iz besedilnega opisa Midjourney je minuli teden dobil novo verzijo Midjourney 5.2. Ta prinaša nekaj uporabnih novosti, med katerimi bodo naročniki bržkone najbolj veseli možnosti zoom out, ki deluje podobno kot outpainting v konkurenčnem DALL-E. To uporabniku omogoča, da vzame obstoječo sliko in jo ohrani kot osrednji del nove slike, medtem ko Midjourney doriše okolico.

Druge novosti so takisto koristne. Prenovljeni "estetski sistem" obljublja boljšo kakovost posnetkov. Ukaz "--stylize" določa, kako realistična bo podoba. Odslej bo nova funkcija high variation mode privzeto vključena, s čimer bodo razlike med generacijami podob večje.

Novi model eksplicitno vključimo v nastavitvah (/settings) ali s stikalom "--v 5.2". Ključne kvalitativne razlike so več podrobnosti, boljše barve, ostrejše slike in kompleksne kompozicije. Prav tako naj bi bolje razumel opise in parameter "--stylize". Kdor želi uporabljati stari model,...

11 komentarjev

Midjourney zaradi zlorab onesposobil brezplačno preizkusno verzijo

Umetna slika

Slo-Tech - Splet so minuli teden preplavile fotografije aretacije nekdanjega ameriškega predsednika, ki se seveda ni nikoli zgodila. Nastale so z orodjem Midjourney, ki omogoča ustvarjanje realističnih generativnih fotografij, podobno kot ChatGPT piše besedila in kot DALL-E riše. Čeprav je Midjourney plačljiva storitev, je bila na voljo tudi brezplačna preizkusna možnost, ki je povsem zadostovala za nekaj posnetkov. Ti so bili tako dobri, da so ljudje za kratek čas celo verjeli, da je papež nosil stilsko belo puhovko.

Sedaj je brezplačnih posnetkov konec
. Midjourney, ki stane od 10 dolarjev mesečno dalje, je ukinil prvih 25 brezplačni posnetkov. Ustanovitelj podjetja David Holz je pojasnil, da so zaznali izjemno povpraševanje in pogoste zlorabe. Zanimivo je, da je bil še pred pol leta Midjourney preslab, da bi lahko koga ukanil, dandanes pa so njegovi posnetki viralni. Težavna pa je predvsem njihova kakovost, zaradi katerih je na prvi pogled nemogoče ugotoviti, da so lažni. Seveda podroben...

29 komentarjev

Midjourney 5 je tu!

Primerjava Midjourney 3, 4 in 5 (od leve proti desni)

Slo-Tech - Izšla je nova verzija algoritma za ustvarjanje fotografij in slik Midjourney, ki je prvikrat ugledal luč sveta pred letom dni. Ta teden so predstavili že peto inačico, ki je dosegla povsem realistično raven. Posvetili so se izrisu kože in obraza, očem, osvetlitvi, odbojem in senčenju. Končni rezultat so ljudje, ki imajo končno pet prstov, ki imajo realistične obrazne poteze in jasne oči. Roke in oči poudarjamo zato, ker so imele vse prejšnje verzije Midjourneyja in tudi konkurence (Stable Diffusion, DALL-E) velike težave na tem področju. Dlani s šestimi ali sedmimi prsti so postale redna šala o nesposobnosti umetne inteligence.

Midjourney 5 teh težav nima več. Za zdaj je na voljo le proti plačilu, medtem ko se bodo morali brezplačni uporabniki zadovoljiti s prejšnjo verzijo. Dostop lahko dobimo na spletni strani in na njihovem Discordu. Avtorji pravijo, da je Midjourney 5 ne le boljši, temveč tudi bolj razgledan. Obvlada več slogov, na vnose (prompt) se odziva bolje, ustvari manj...

2 komentarja

Blender dobil vtičnik za Stable Diffusion

Slo-Tech - Blender, popularno brezplačno orodje za 3-D modeliranje, je pravkar dobilo vtičnik za uporabo generativne umetne inteligence Stable Diffusion. To je model, ki omogoča ustvarjanje slikovnih podob iz besednega opisa in predstavlja odprtokodno implementacijo podobnega orodja kot OpenAI DALL-E. Stable Diffusion je že brezplačno na voljo, sedaj pa so ga še neposredno integrirali v Blender. Z njim lahko podobe ustvarjamo bodisi iz besedil bodisi iz obstoječih slik. V teoriji je možno na tak način ustvariti tudi preproste animacije, a so rezultati še precej primitivni.

Uporaba Stability Diffusiona v Blenderju je brezplačna. Za uporabo ne potrebujemo dodatne strojne opreme niti posebnih grafičnih čipov. V najnovejši verziji Blenderja zadostuje povezava do interneta in ključ za uporabo API, ki ga je možno dobiti brezplačno. Nato namestimo vtičnik, si ogledamo vodiče in krenemo.
Rezultati so precej spodobni, a le v dveh dimenzijah. Ustvarjanje tridimenzionalnih struktur z umetno...

11 komentarjev

Shutterstock bo prodajal grafiko umetne inteligence DALL-E

Slo-Tech - Shutterstock je sklenil dogovor z OpenAI, ki je razvil algoritem DALL-E 2 za računalniško ustvarjanje posnetkov iz besedilnega opisa in ki je že mesec dni dostopen vsem, da bodo stvaritve umetne inteligence na voljo v plačljivih galerijah. Poleg vsebin, ki jih izdelajo ljudje, bo DALL-E 2 edini vir vsebin umetne inteligence. Nalaganje drugih vsebin, ki jih ustvari umetna inteligenca, je sicer prepovedano, ker avtorske pravice (še) niso jasno določene. To je legitimen razlog, ki pa seveda koristi tudi partnerstvu z OpenAI. Iz istega razloga Getty Images ne dovoli posnetkov umetne inteligence.

Izvršni direktor Shutterstocka Paul Hennessy je ob tem dejal, da se načini izražanja in ustvarjalnosti nenehno spreminjajo, čemur morajo slediti. Tak primer je tudi generativna tehnologija, ki stoji za DALL-E 2. Izvršni direktor OpenAI Sam Altman je dodal, da so navdušeni nad novim partnerstvom. Uporabniki Shutterstocka bodo namreč lahko nove fotografije generirali neposredno ob iskanju, saj...

9 komentarjev

Računalnik zna iz navodil generirati video

vir: Google
Slo-Tech - V Meti in Googlu so predstavili strojno učena algoritma, ki iz pisanih navodil ustvarjata kratke filmčke.

Po tem, ko so algoritmi za generiranje slik iz tekstovnih navodil pošteno razburkali področje strojnega učenja, smo očitno že pri naslednji etapi v razvoju tovrstne umetne inteligence: gibljivih sličicah. Že letos spomladi so takšno programje, CogVideo, pokazali v kitajski raziskovalni skupini z univerze Tsinghua in Pekinške akademije za umetno inteligenco, sedaj pa so se na področje pognali tudi zahodni IT velikani. Najprej je konec septembra Metin laboratorij razkril algoritem Make-A-Video, pred dnevi pa so v Googlu pokazali še podobnega Imagen Video. Oba ustvarjata zelo kratke, petsekundne skupke gibljivih sličic, ki so sicer bolj animacije GIF kot pa resni video posnetki, pa vendarle - kot se je že pohvalil Zuckerberg, gre za novo področje napredka v strojni inteligenci, ki je še za stopnjo višje od generiranja slik iz navodil, in daje tudi primerno osupljive rezultate. S...

8 komentarjev

DALL-E je sedaj prosto na voljo

openai.com - Pri OpenAI so odstranili čakalno vrsto za svoj slikovni algoritem DALL-E, s čimer predvsem odgovarjajo vse srditejši konkurenci, kot je Stable Diffusion.

Algoritemsko generiranje sličic iz teksta je eno najbolj zanimivih področij informacijske tehnologije v letošnjem letu; tako zaradi dih jemajočih podob, ki jih sedaj že na dnevni bazi sproducira množica uporabnikov širom sveta, kakor tudi zares nore hitrosti razvoja. Po tem, ko je družba OpenAI letošnjega aprila pokazala drugo generacijo algoritma DALL-E, namreč ne mine mesec, da ne bi na plano pokukal nov izzivalec, kakšna nova funkcija ali pa bizaren dogodek, kot je zmaga algoritemsko ustvarjene slike na umetniškem natečaju. Medtem ko je bilo še spomladi videti, da se bodo med seboj udarili tehnološki velikani ali vsaj z njihovim denarjem podprte entitete, pa se v zadnjem času v ospredje prebijajo tudi samostojne in odprte rešitve, kot sta Midjourney ter Stable Diffusion. Posebno slednji je zaradi odprtokodne narave v začetku...

28 komentarjev

DALL-E zna sliko nadaljevati izven okvirjev

openai.com - V družbi za razvoj strojnega učenja OpenAI so predstavili novo zmogljivost svojega algoritma za generiranje slik DALL-E: vzorčno podobo zna z nekaj tekstovne pomoči nadaljevati izven prvotnih okvirjev.

Strojno generiranje podob iz tekstovnih navodil je trenutno eno najzanimivejših področij strojnega učenja. Ne zgolj zaradi bliskovitega napredka, saj novi algoritmi v tehnološko tekmo vstopajo skorajda mesečno, temveč tudi zaradi stvarnega učinka v praksi. Rešitve so se namreč že pririnile v dejanske izdelke; tako je TikTok sredi avgusta predstavil samodejno ustvarjanje risanih ozadij, ki se sicer ne more primerjati s slikarijami s čela napredka, a to niti ni namen. Tudi že lahko vidimo učinek na področje likovne umetnosti, saj se algoritmi že aktivno uporabljajo kot orodje, kar sproža vrsto polemik tako glede avtorstva kakor realne umetniške vrednosti slik, ki so bile ustvarjene s strojno pomočjo. Segment je torej sredi zelo aktivnega razvoja - in laboratoriji za strojno pamet so...

12 komentarjev

Generiranje slik iz teksta postaja tekma

tale korgi ni resničen

vir: Google
Google - Googlov laboratorij za strojno učenje je predstavil algoritem Imagen, za katerega trdijo, da ustvarja še boljše podobe kot OpenAIjev DALL-E 2.

Zadnji krik področja umetne inteligence so bržkone algoritmi za generiranje slik iz tekstovnih opisov, saj znajo ponekod ustvariti hudo markantne rezultate, kot je podoba tujske hobotnice s časopisom v rokah, ki lebdi skozi portal ali jutranje nakupovalne mrzlice v ekspresionističnem slogu. Z idejo so najbolj udarno pričeli v hiši OpenAI, ko so v začetku lanskega leta predstavili algoritem DALL-E, ki je pred poldrugim mesecem prešel v pošteno nadgrajeno drugo generacijo. Zdaj so se gibanju pridružili še v Googlu in predstavili algoritem Imagen. Kot večina tosortnih programov, tudi Imagen uporablja difuzni model, pri čemer zvito najprej ustvari nizkoločljivostno podobo, ki jo nato razteguje skozi več podalgoritmov, prav tako z difuznimi modeli.

Googlovi inženirji trdijo, da zanesljivo proizvaja boljše podobe od DALL-Eja 2 in so v ta namen...

6 komentarjev

OpenAI predstavil drugo generacijo algoritma DALL-E

openai.com - Laboratorij za strojno učenje OpenAI je pokazal algoritem DALL-E 2, za generiranje slik, ki bistveno nadgrajuje predhodnika in ustvarja navdušujoče verodostojne ter podrobne podobe (tudi) astronavtov na konju v rahlem drncu po Luni.

Lanskega januarja so v družbi za raziskovanje strojne inteligence OpenAI presenetili z algoritmom, ki je znal iz tekstovnega navodila presenetljivo dobro ustvariti želeno podobo. DALL-E je sicer res zvečine izrisal majhne sličice, ki so bile obenem značilno razmazane, kakor smo pri umetni pameti še vedno vajeni - toda že samo dejstvo, da je znal računalnik narisati "stol v podobi avokada", je presunil strokovno javnost. Na tej osnovi je področje hitro napredovalo in postreglo z zanimivimi aplikacijami, kot je Dream ali Baidujev algoritem ERNIE-ViLG. Pred dnevi so v OpenAI predstavili naslednika, DALL-E 2. Tudi njegove sposobnosti milo rečeno sezujejo, saj zna med drugim izrisati "plišaste medvedke v podobi norih znanstvenikov" ali "toplo oblečeno mišjo...

19 komentarjev

OpenAI nadgrajuje algoritem GPT-3 s prepoznavanjem slik

New Scientist - V laboratoriju za strojno učenje OpenAI so predstavili dva zanimiva nova algoritma, DALL-E in CLIP, ki gradita na njihovem razvpitem generatorju besedil GPT-3. Z njima zmogljivost prepoznave in ustvarjanja teksta prenašajo še na področje slik, s čimer želijo strojni inteligenci omogočiti več različnih smeri za učenje in povezovanje znanja.

Firma OpenAI je lani navdušila z algoritmom za ustvarjanje teksta GPT-3, ki iz kratkega nastavka napravi občasno kar strašljivo prepričljiva besedila. Toda kolikor so te sorte programi na prvi pogled impresivni, se začno hitro kazati njihove omejitve, ko jih pregledamo natančneje. GPT-3 se pri daljših besedilih izgubi, predvsem pa kaj kmalu postane jasno, da v resnici sploh ne razume, kaj besediči. Prav učenje dejanskega razumevanja ustvarjene vsebine je naslednja pomembna stopnica, na katero bo morala strojna inteligenca stopiti za nove preboje. Izziva so se v OpenAIju lotili tako, da so GPT-3 združili s prepoznavo in ustvarjanjem slikovnih...

1 komentar

OpenAIjev pisalni algoritem GPT-3 je v beta testiranju

vir: Axios
Axios - Strojni algoritem za pisanje besedil GPT-3 - naslednik razvpitega GPT-2, ki si ga laboratorij OpenAI sprva menda ni upal spustiti v divjino - je prešel v fazo polodprtega javnega testiranja. Preizkuševalci so večjidel navdušeni, a zadeva še vedno kaže jasne omejitve trenutne generacije takšnih algoritmov.

Lanskega februarja je ena najbolj izpostavljenih razvojnih hiš za strojno učene algoritme, OpenAI, pokazala GPT-2, strojno inteligenco za pisanje prepričljivih besedil. Inženirji so takrat populistično dejali, da bi bilo program "tvegano ga kar tako spustiti iz laboratorijskih soban", zainteresirana javnost pa je seveda ugibala, ali gre za marketinško puhlico ali realne nevarnosti. GPT-2 je bil nedvomno korak naprej, saj je v nekaterih primerih izpisal srhljivo prepričljive skupke teksta, obenem pa je bila OpenAI takrat zares še neprofitna firma. Toda tekom lanskega leta se je situacija spremenila: družba se je usmerila v komercialne vode in v ta namen ustanovila tržno podružnico...

17 komentarjev

OpenAI je ustvaril algoritem, ki si ga ne upa spustiti v divjino

theguardian.com - V laboratoriju za strojno inteligenco OpenAI so napravili algoritem za generiranje besedil, ki je po njihovem mnenju prenevaren, da bi ga v celoti dali v javnost.

Strojni algoritmi danes ne znajo zgolj prepoznavati vzorcev, temveč tudi ustvarjati nove vsebine, na primer slike in obraze. Seveda so še na stopnji, ko pozornega človeka zelo težko pretentajo, saj je večina njihovih stvaritev nepopolna, dostikrat pa naravnost groteskna. Toda očitno prihajamo v čas, ko bo strojna pamet postala tako sposobna, da bodo njene stvaritve težko razločljive od človeških. V družbi OpenAI, za katero stoji Elon Musk, so namreč ustvarili generator tekstovnih besedil, ki ga ne želijo spustiti iz laboratorija. Menijo, da je tako učinkovit, da bi pomenil...

52 komentarjev