openai.com - Pri OpenAI so odstranili čakalno vrsto za svoj slikovni algoritem DALL-E, s čimer predvsem odgovarjajo vse srditejši konkurenci, kot je Stable Diffusion.
Algoritemsko generiranje sličic iz teksta je eno najbolj zanimivih področij informacijske tehnologije v letošnjem letu; tako zaradi dih jemajočih podob, ki jih sedaj že na dnevni bazi sproducira množica uporabnikov širom sveta, kakor tudi zares nore hitrosti razvoja. Po tem, ko je družba OpenAI letošnjega aprila pokazala drugo generacijo algoritma DALL-E, namreč ne mine mesec, da ne bi na plano pokukal nov izzivalec, kakšna nova funkcija ali pa bizaren dogodek, kot je zmaga algoritemsko ustvarjene slike na umetniškem natečaju. Medtem ko je bilo še spomladi videti, da se bodo med seboj udarili tehnološki velikani ali vsaj z njihovim denarjem podprte entitete, pa se v zadnjem času v ospredje prebijajo tudi samostojne in odprte rešitve, kot sta Midjourney ter Stable Diffusion. Posebno slednji je zaradi odprtokodne narave v začetku septembra močno zaostril tekmo, a s seboj nosi tudi povečana tveganja, saj rahljanje omejitev pomeni slabši nadzor nad etično kočljivo vsebino, ki jo tak algoritem napravi.
V OpenAI so dolgo čakalno vrsto za tiste, ki so se namenili uporabljati DALL-Eja, opravičevali ravno s pedantnim preizkušanjem zavor v algoritmu in uporabniškem vmesniku, ki naj bi preprečile pobezljano širjenje lažnih podob in takšnih s kočljivo, denimo pornografsko ali rasistično vsebino. Med drugim so se poslužili tudi prijemov, kot je nevidno samodejno dodajanje napotkov stroju, da se denimo doda etnična raznolikost v rezultate, kar seveda mnogim uporabnikom ni všeč, ker omeji njihov nadzor nad algoritmom. Kakorkoli, tekmeci so OpenAI očitno pripravili do tega, da je čakalno vrsto odstranil, tako da se lahko čaranja z DALL-Ejem loti vsakdo. Gre za komercialni izdelek, ki ga zaračunavajo preko žetonov, s katerimi zaukažemo izdelavo posameznih slik. Uporabnik ob prijavi prejme 50 brezplačnih žetonov in nato še 15 novih vsak mesec, nakar gredo nadaljnji za približno 15 evrov na 115 kosov.
For example, DALL-E invisibly inserts phrases like “Black man” and “Asian woman” into user prompts that do not specify gender or ethnicity in order to nudge the system away from generating images of white people.
Po svoje je to lahko problematično, če nekdo želi sliko Eve, kako trga jabolko z drevesa in samo vpiše "Goli človek na drevesu".
s pedantnim preizkušanjem zavor v algoritmu in uporabniškem vmesniku, ki naj bi preprečile pobezljano širjenje ... podob ... s kočljivo, denimo pornografsko ... vsebino
Hudiča, pa je šla velika množica potencialnih uporabnikov in preizkuševalcev po gobe
The main failure in computers is usually located between keyboard and chair.
You read what you believe and you believe what you read ...
Nisam čit'o, ali osudjujem (nisem bral, a obsojam).
Sem poskusil. Simbole, naravo, arhitekturo ... skoraj vse ... generira v osupljivo natančniem kontekstu, ampak človeške obraze pa naredi za v grozljivko
Kake grozote bodo šele generirane, ko orodje v roke dobijo porno izprijenci. Po mojem bo treba ponovno odpreti sanatorije za tiste izpostavljene bolanim "promptom".
Hmm, v bistvu izgleda, da tale SD ej-aj dosti rad "riše" ljudi v hrbet, dosti slik so samo silhuete, pogosto od zadaj. Verjetno kot enostavna rešitev problema z demoničnimi facami.
"" ... The Stable Diffusion model is trained on a dataset consisting of 512×512 resolution images,[4][14] meaning that txt2img output images are optimally configured to be generated at 512×512 resolution as well, and deviating from this size can result in poor quality generation outputs. ""
Obrazi so namerno zblurani zaradi deep fake iskoriščanja in ne zaradi tega kaj je AI neumen. Ampak je zadeva bolana, čeprav se pol sprašuješ ali bomo čez x let sploh še rabili grafične dizajnere...