»

Googlov algoritem Lumiere zna spreminjati slog videa

vir: Google
Google - Pri Googlu so razkrili algoritem za generiranje videa Lumiere, ki tako po funkcijah kot prepričljivosti pošteno prekaša obstoječe rešitve.

Strojno ustvarjanje video posnetkov iz besedilnih ukazov sicer (še) ni tako v ospredju kot generatorji slik, saj gre za bistveno zahtevnejše področje, a prav tako napreduje s kar srhljivo naglico. Če smo se jeseni leta 2022 še nasmihali ob sila okornih pojavah na gibljivih sličicah iz Mete in Googla, je že v poldrugem letu situacija zaznavno drugačna, tako glede tehnologije kot razširjenosti. V Meti so lanskega novembra predstavili algoritem Emu, ki naj bi v prihodnje postal pomembno orodje za ustvarjanje vsebin na njihovih družbenih omrežjih. Podobno kot pri slikah, imamo tudi tu kopico izzivalcev, na primer orodje Runway; poleg pa je tudi Stability AI z odprtokodno različico takšnega programja, Stable Video Diffusion. Zvečine gre za kombinirane difuzne modele, ki skušajo glede na navodila najprej zgenerirati posamezne jedrne sličice, ki jih...

9 komentarjev

Iz navodil generiramo tudi 3D objekte

Magic3D

vir: Nvidia
Slo-Tech - Po slikah in videu se tekma v ustvarjanju digitalnih vsebin iz tekstovnih navodil začenja tudi pri 3D predmetih. Nvidia je z orodjem Magic3D odgovorila Googlu, ki je prejšnji mesec predstavil algoritem DreamFusion.

Algoritmi za generiranje vsebin iz navodil so bržkone prva tehnološka noviteta tega leta in trenutno pošteno burkajo področje umetnosti, ker sprožajo temeljna pravna ter etična vprašanja o tem, kdo si lahko lasti umetniške zamisli in na kakšen način jih lahko drugi povzemajo. Razvoj programja pa gre med temi polemikami nezadržno dalje: po tem, ko se je s področja 2D podob najprej prenesel še na gibljive sličice, oziroma kratki video format, je naslednja postaja ustvarjanje 3D objektov. Sredi oktobra so pri Googlu pokazali orodje DreamFusion, ki je prav tako izpeljanka iz njihovega difuznega slikovnega modela Imagen. Tridimenzionalne objekte napravi v dveh potezah; najprej z Imagenom nastane sličica, ki jo nato skozi metodo NeRF (Neural Radiance Fields) pretvorijo še v...

7 komentarjev

Računalnik zna iz navodil generirati video

vir: Google
Slo-Tech - V Meti in Googlu so predstavili strojno učena algoritma, ki iz pisanih navodil ustvarjata kratke filmčke.

Po tem, ko so algoritmi za generiranje slik iz tekstovnih navodil pošteno razburkali področje strojnega učenja, smo očitno že pri naslednji etapi v razvoju tovrstne umetne inteligence: gibljivih sličicah. Že letos spomladi so takšno programje, CogVideo, pokazali v kitajski raziskovalni skupini z univerze Tsinghua in Pekinške akademije za umetno inteligenco, sedaj pa so se na področje pognali tudi zahodni IT velikani. Najprej je konec septembra Metin laboratorij razkril algoritem Make-A-Video, pred dnevi pa so v Googlu pokazali še podobnega Imagen Video. Oba ustvarjata zelo kratke, petsekundne skupke gibljivih sličic, ki so sicer bolj animacije GIF kot pa resni video posnetki, pa vendarle - kot se je že pohvalil Zuckerberg, gre za novo področje napredka v strojni inteligenci, ki je še za stopnjo višje od generiranja slik iz navodil, in daje tudi primerno osupljive rezultate. S...

8 komentarjev

Generiranje slik iz teksta postaja tekma

tale korgi ni resničen

vir: Google
Google - Googlov laboratorij za strojno učenje je predstavil algoritem Imagen, za katerega trdijo, da ustvarja še boljše podobe kot OpenAIjev DALL-E 2.

Zadnji krik področja umetne inteligence so bržkone algoritmi za generiranje slik iz tekstovnih opisov, saj znajo ponekod ustvariti hudo markantne rezultate, kot je podoba tujske hobotnice s časopisom v rokah, ki lebdi skozi portal ali jutranje nakupovalne mrzlice v ekspresionističnem slogu. Z idejo so najbolj udarno pričeli v hiši OpenAI, ko so v začetku lanskega leta predstavili algoritem DALL-E, ki je pred poldrugim mesecem prešel v pošteno nadgrajeno drugo generacijo. Zdaj so se gibanju pridružili še v Googlu in predstavili algoritem Imagen. Kot večina tosortnih programov, tudi Imagen uporablja difuzni model, pri čemer zvito najprej ustvari nizkoločljivostno podobo, ki jo nato razteguje skozi več podalgoritmov, prav tako z difuznimi modeli.

Googlovi inženirji trdijo, da zanesljivo proizvaja boljše podobe od DALL-Eja 2 in so v ta namen...

6 komentarjev

OpenAI predstavil drugo generacijo algoritma DALL-E

openai.com - Laboratorij za strojno učenje OpenAI je pokazal algoritem DALL-E 2, za generiranje slik, ki bistveno nadgrajuje predhodnika in ustvarja navdušujoče verodostojne ter podrobne podobe (tudi) astronavtov na konju v rahlem drncu po Luni.

Lanskega januarja so v družbi za raziskovanje strojne inteligence OpenAI presenetili z algoritmom, ki je znal iz tekstovnega navodila presenetljivo dobro ustvariti želeno podobo. DALL-E je sicer res zvečine izrisal majhne sličice, ki so bile obenem značilno razmazane, kakor smo pri umetni pameti še vedno vajeni - toda že samo dejstvo, da je znal računalnik narisati "stol v podobi avokada", je presunil strokovno javnost. Na tej osnovi je področje hitro napredovalo in postreglo z zanimivimi aplikacijami, kot je Dream ali Baidujev algoritem ERNIE-ViLG. Pred dnevi so v OpenAI predstavili naslednika, DALL-E 2. Tudi njegove sposobnosti milo rečeno sezujejo, saj zna med drugim izrisati "plišaste medvedke v podobi norih znanstvenikov" ali "toplo oblečeno mišjo...

19 komentarjev

Android 12 s prenovljeno obliko

Slo-Tech - Google je na razvijalski konferenci I/O 2021 pokazal vmesnik Androida 12 s precej prenovljenim videzom, katerega barvna paleta se prilagaja izbranemu ozadju.

Googlova letošnja konferenca za razvijalce I/O je v polnem teku in kot je običajno, se je pričela z najavo prihajajočih novosti (skrajšan video povzetek). V skoraj dveurni predstavitvi je poleg najave operacijskega sistema Wear najpomembnejše mesto zasedala prenova izgleda Androida, ki bo s prihajajočo dvanajsto različico postal bolj ... zaobljen. Novemu dizajnu pri Googlu pravijo Material You, njegova poglavitna zmogljivost pa bo tudi v prilagajanju barv izbrani sliki ozadja. To sicer ni prvi takšen poskus, saj so v Androidu 5 nekaj podobnega poskušali s Palette API, a tokrat naj bi bila implementacija precej pogumnejša. Sredi tedna je prispela tudi beta inačica, ki pa zaenkrat nosi le del najavljenih novosti.



Spisek razkritij na uvodni tiskovki je bil sicer precej obsežen. Med zanimivejšimi je Project Starline, s katerim...

14 komentarjev

Ryzomova izvorna koda dostopna!

Slashdot - Winch Gate Properties, razvijalec in založnik popularne množične večigralske spletne igre igranja vlog (MMORPG), Ryzom je izdal izvorno kodo in spremljajoče skice in druge grafične materiale za Ryzom skupnosti Free Software Foundation. Razvijalci si lahko odslej pogledajo izvorno kodo verzije za končnega igralca, orodja za izdelavo vsebine in strežniško aplikacijo, če želijo izdelati popravke, dodatke, modifikacije ali svoje...

15 komentarjev