DALL-E zna sliko nadaljevati izven okvirjev

Jurij Kristan

5. sep 2022 ob 22:50:03

V družbi za razvoj strojnega učenja OpenAI so predstavili novo zmogljivost svojega algoritma za generiranje slik DALL-E: vzorčno podobo zna z nekaj tekstovne pomoči nadaljevati izven prvotnih okvirjev.

Strojno generiranje podob iz tekstovnih navodil je trenutno eno najzanimivejših področij strojnega učenja. Ne zgolj zaradi bliskovitega napredka, saj novi algoritmi v tehnološko tekmo vstopajo skorajda mesečno, temveč tudi zaradi stvarnega učinka v praksi. Rešitve so se namreč že pririnile v dejanske izdelke; tako je TikTok sredi avgusta predstavil samodejno ustvarjanje risanih ozadij, ki se sicer ne more primerjati s slikarijami s čela napredka, a to niti ni namen. Tudi že lahko vidimo učinek na področje likovne umetnosti, saj se algoritmi že aktivno uporabljajo kot orodje, kar sproža vrsto polemik tako glede avtorstva kakor realne umetniške vrednosti slik, ki so bile ustvarjene s strojno pomočjo. Segment je torej sredi zelo aktivnega razvoja - in laboratoriji za strojno pamet so začeli svojim algoritmom dodajati funkcije, s katerimi želijo ojačati njihovo tržno vrednost.

Pri OpenAI, kjer so norijo pognali z nastankom algoritma DALL-E, so predstavili njegovo najnovejšo pridobitev, ki jo imenujejo outpainting. Algoritem zna sedaj vzorčno podobo nadaljevati izven njenih prvotnih okvirjev. Pri tem sicer še vedno potrebuje nekaj tekstovnih navodil, s katerimi mu povemo, kaj naj pravzaprav v praznini stoji, DALL-E pa v prvi vrsti ohrani slog vzorčne slike. Tako gre v resnici za izpopolnjeno instrumentalizacijo zmogljivosti, ki jo je ta algoritem po malem že imel, saj smo mu lahko že v prvotni različici druge generacije naročili, naj se ukvarja z določenim odsekom slikarskega platna. Tako se želijo avtorji očitno nekako ločiti od tekmecev, kot so Imagen, Midjourney in Stable Diffusion. Opazovalcem pa verjetno ne bo ušla ironija, da gre za podobno funkcionalnost kot pri generatorjih teksta - pri čemer je bil razvpiti GPT-3 pravzaprav navdih za prvo zasnovo DALL-Eja.