» »

Googlov algoritem Lumiere zna spreminjati slog videa

Googlov algoritem Lumiere zna spreminjati slog videa

vir: Google
Google - Pri Googlu so razkrili algoritem za generiranje videa Lumiere, ki tako po funkcijah kot prepričljivosti pošteno prekaša obstoječe rešitve.

Strojno ustvarjanje video posnetkov iz besedilnih ukazov sicer (še) ni tako v ospredju kot generatorji slik, saj gre za bistveno zahtevnejše področje, a prav tako napreduje s kar srhljivo naglico. Če smo se jeseni leta 2022 še nasmihali ob sila okornih pojavah na gibljivih sličicah iz Mete in Googla, je že v poldrugem letu situacija zaznavno drugačna, tako glede tehnologije kot razširjenosti. V Meti so lanskega novembra predstavili algoritem Emu, ki naj bi v prihodnje postal pomembno orodje za ustvarjanje vsebin na njihovih družbenih omrežjih. Podobno kot pri slikah, imamo tudi tu kopico izzivalcev, na primer orodje Runway; poleg pa je tudi Stability AI z odprtokodno različico takšnega programja, Stable Video Diffusion. Zvečine gre za kombinirane difuzne modele, ki skušajo glede na navodila najprej zgenerirati posamezne jedrne sličice, ki jih povežejo in povečajo v končni video.



Pri Googlu so sedaj predstavili algoritem Lumiere, ki takšno magijo počne malo drugače. Kot razlagajo v objavi na Arxivu, so sestavili arhitekturo, ki jo imenujejo Space-Time UNet (STUNet) in ki zna - po kmečko povedano - identificirati objekte v sceni in predvideti, kako se bodo obnašali, ko poženemo uro. Zato je Lumiere sposobnejši od konkurence, saj mu je mogoče med drugim naložiti, naj nekatere objekte v videu izriše v drugačnem slogu in denimo ljudi napravi iz plastelina. Rezultat so petsekundni video posnetki v ločljivosti 1024×1024 pik in s 16 sličicami na sekundo, oziroma skupno 80 sličic. Izvor baze podatkov, na kateri se je algoritem učil, ni znan, je pa obsegal 30 milijonov označenih posnetkov. Lumiere ta hip še ni prosto na voljo in bržkone še nekaj časa ne bo. Avtorji namreč opozarjajo, da bodo morali pred lansiranjem vdelati zanesljivejše varnostne elemente za preprečevanje zlorab, kot je aktualna z generiranimi podobami Taylor Swift.

9 komentarjev

Gregor P ::

Izvor baze podatkov, na kateri se je algoritem učil, ni znan, je pa obsegal 30 milijonov označenih posnetkov.

Kako ni znan? Milijarda YT posnetkov, ki smo jim jih dali vsi na voljo.>:D
The main failure in computers is usually located between keyboard and chair.
You read what you believe and you believe what you read ...
Nisam čit'o, ali osudjujem (nisem bral, a obsojam).

WhiteAngel ::

Uf, še veliko dela jih čaka :8) Pa tele groteskne oči 8-O Za GOOGL držat nad vodo bo ok.

Karamelo ::

WhiteAngel je izjavil:

Uf, še veliko dela jih čaka :8) Pa tele groteskne oči 8-O Za GOOGL držat nad vodo bo ok.


to so malenkosti...največji preboj jim je že ratal, poglej naprimer kako je bilo z generacijo slik...na začetku leta katastrofalne slike, na koncu pa take, da jih ne moreš ločit od realnosti.. isto bo pri videih..v 3 letih boš imel nekaj minutne videe visoke ločljivosti

Bezukhoff ::

And then we can make our own Star Wars, with blackjack and hookers.

nodrim ::

To blo kr hudo v bistvu, vzameš film in čist vsako sceno spremeniš z enakim slogom in dodatnimi vsebinskimi spremembami in jih pol zlepiš nazaj in si končal s predelavo in celo dobiš nekaj gledljivega.

Karamelo ::

filmi bodo takšni...na začetku filma si boš zbral kakšne barve obleko bo imela glavna igralka, in AI bo v realtime spreminjal film, da bo po tvojem okusu, vsak gledalec bo imel isti film po svojem okusu realtime

Gregor P ::

To je že fino, kot je po drugi strani tudi res, da jaz rad gledam filme drugih (priznanih ustvarjalcev), da vidim, kako si oni to predstavljajo, razmišljajo in vizualizirajo, da malo razširim lastna obzorja:)
The main failure in computers is usually located between keyboard and chair.
You read what you believe and you believe what you read ...
Nisam čit'o, ali osudjujem (nisem bral, a obsojam).

WhiteAngel ::

Karamelo je izjavil:

WhiteAngel je izjavil:

Uf, še veliko dela jih čaka :8) Pa tele groteskne oči 8-O Za GOOGL držat nad vodo bo ok.


to so malenkosti...največji preboj jim je že ratal, poglej naprimer kako je bilo z generacijo slik...na začetku leta katastrofalne slike, na koncu pa take, da jih ne moreš ločit od realnosti.. isto bo pri videih..v 3 letih boš imel nekaj minutne videe visoke ločljivosti


Ne, to niso malenkosti. Problem je isti kot pri GPTju. Gre za lepljenje zgeneriranih fragmentov. Zato taka težava s prsti in obrazi. Pri videih zgoraj je očitna težava na robovih skupkov. In to ni enostavno rešljiv problem, ker ti zmanjka računske moči, če želiš razumeti kontekst in narediti video realen. Za nišne reči bo verjetno ok, za efekte, filtre, night clube... Daleč pa od realnega videa.

Karamelo ::

WhiteAngel je izjavil:

Karamelo je izjavil:

WhiteAngel je izjavil:

Uf, še veliko dela jih čaka :8) Pa tele groteskne oči 8-O Za GOOGL držat nad vodo bo ok.


to so malenkosti...največji preboj jim je že ratal, poglej naprimer kako je bilo z generacijo slik...na začetku leta katastrofalne slike, na koncu pa take, da jih ne moreš ločit od realnosti.. isto bo pri videih..v 3 letih boš imel nekaj minutne videe visoke ločljivosti


Ne, to niso malenkosti. Problem je isti kot pri GPTju. Gre za lepljenje zgeneriranih fragmentov. Zato taka težava s prsti in obrazi. Pri videih zgoraj je očitna težava na robovih skupkov. In to ni enostavno rešljiv problem, ker ti zmanjka računske moči, če želiš razumeti kontekst in narediti video realen. Za nišne reči bo verjetno ok, za efekte, filtre, night clube... Daleč pa od realnega videa.


ja no, poglej si razliko v enem letu v generaciji slik naprimer, neverjeten preskok


Vredno ogleda ...

TemaSporočilaOglediZadnje sporočilo
TemaSporočilaOglediZadnje sporočilo
»

Microsoft razvil zmogljiv algoritem za posnemanje govora

Oddelek: Novice / Znanost in tehnologija
104081 (3229) bbf
»

Iz navodil generiramo tudi 3D objekte

Oddelek: Novice / Znanost in tehnologija
74053 (3407) garamond
»

Računalnik zna iz navodil generirati video

Oddelek: Novice / Znanost in tehnologija
86526 (5515) lemur233
»

brezplačen video urejevalnik

Oddelek: Programska oprema
286224 (5415) opeter
»

Izšel LiVES 1.0.0

Oddelek: Novice / Ostala programska oprema
194502 (3200) poweroff

Več podobnih tem