Googlov algoritem Lumiere zna spreminjati slog videa @ Slo-Tech

Novice » Ostala programska oprema »
Googlov algoritem Lumiere zna spreminjati slog videa

Googlov algoritem Lumiere zna spreminjati slog videa

Jurij Kristan :: 28. jan 2024 ob 21:30
Ostala programska oprema

Google - Pri Googlu so razkrili algoritem za generiranje videa Lumiere, ki tako po funkcijah kot prepričljivosti pošteno prekaša obstoječe rešitve.

Strojno ustvarjanje video posnetkov iz besedilnih ukazov sicer (še) ni tako v ospredju kot generatorji slik, saj gre za bistveno zahtevnejše področje, a prav tako napreduje s kar srhljivo naglico. Če smo se jeseni leta 2022 še nasmihali ob sila okornih pojavah na gibljivih sličicah iz Mete in Googla, je že v poldrugem letu situacija zaznavno drugačna, tako glede tehnologije kot razširjenosti. V Meti so lanskega novembra predstavili algoritem Emu, ki naj bi v prihodnje postal pomembno orodje za ustvarjanje vsebin na njihovih družbenih omrežjih. Podobno kot pri slikah, imamo tudi tu kopico izzivalcev, na primer orodje Runway; poleg pa je tudi Stability AI z odprtokodno različico takšnega programja, Stable Video Diffusion. Zvečine gre za kombinirane difuzne modele, ki skušajo glede na navodila najprej zgenerirati posamezne jedrne sličice, ki jih povežejo in povečajo v končni video.

Pri Googlu so sedaj predstavili algoritem Lumiere, ki takšno magijo počne malo drugače. Kot razlagajo v objavi na Arxivu, so sestavili arhitekturo, ki jo imenujejo Space-Time UNet (STUNet) in ki zna - po kmečko povedano - identificirati objekte v sceni in predvideti, kako se bodo obnašali, ko poženemo uro. Zato je Lumiere sposobnejši od konkurence, saj mu je mogoče med drugim naložiti, naj nekatere objekte v videu izriše v drugačnem slogu in denimo ljudi napravi iz plastelina. Rezultat so petsekundni video posnetki v ločljivosti 1024×1024 pik in s 16 sličicami na sekundo, oziroma skupno 80 sličic. Izvor baze podatkov, na kateri se je algoritem učil, ni znan, je pa obsegal 30 milijonov označenih posnetkov. Lumiere ta hip še ni prosto na voljo in bržkone še nekaj časa ne bo. Avtorji namreč opozarjajo, da bodo morali pred lansiranjem vdelati zanesljivejše varnostne elemente za preprečevanje zlorab, kot je aktualna z generiranimi podobami Taylor Swift.

9 komentarjev

Gregor P :: 29. jan 2024, 08:27

Izvor baze podatkov, na kateri se je algoritem učil, ni znan, je pa obsegal 30 milijonov označenih posnetkov.

Kako ni znan? Milijarda YT posnetkov, ki smo jim jih dali vsi na voljo. >:D

The main failure in computers is usually located between keyboard and chair.
You read what you believe and you believe what you read ...
Nisam čit'o, ali osudjujem (nisem bral, a obsojam).

WhiteAngel :: 29. jan 2024, 08:46

Uf, še veliko dela jih čaka :8)

Pa tele groteskne oči 8-O

Za GOOGL držat nad vodo bo ok.

Karamelo :: 29. jan 2024, 11:17

WhiteAngel je 29. jan 2024 ob 08:46 izjavil:

Uf, še veliko dela jih čaka Pa tele groteskne oči Za GOOGL držat nad vodo bo ok.

to so malenkosti...največji preboj jim je že ratal, poglej naprimer kako je bilo z generacijo slik...na začetku leta katastrofalne slike, na koncu pa take, da jih ne moreš ločit od realnosti.. isto bo pri videih..v 3 letih boš imel nekaj minutne videe visoke ločljivosti

Bezukhoff :: 29. jan 2024, 11:30

And then we can make our own Star Wars, with blackjack and hookers.

nodrim :: 29. jan 2024, 16:29

To blo kr hudo v bistvu, vzameš film in čist vsako sceno spremeniš z enakim slogom in dodatnimi vsebinskimi spremembami in jih pol zlepiš nazaj in si končal s predelavo in celo dobiš nekaj gledljivega.

Karamelo :: 29. jan 2024, 16:50

filmi bodo takšni...na začetku filma si boš zbral kakšne barve obleko bo imela glavna igralka, in AI bo v realtime spreminjal film, da bo po tvojem okusu, vsak gledalec bo imel isti film po svojem okusu realtime

Gregor P :: 29. jan 2024, 20:21

To je že fino, kot je po drugi strani tudi res, da jaz rad gledam filme drugih (priznanih ustvarjalcev), da vidim, kako si oni to predstavljajo, razmišljajo in vizualizirajo, da malo razširim lastna obzorja

The main failure in computers is usually located between keyboard and chair.
You read what you believe and you believe what you read ...
Nisam čit'o, ali osudjujem (nisem bral, a obsojam).

WhiteAngel :: 29. jan 2024, 23:26

Karamelo je 29. jan 2024 ob 11:17 izjavil:

WhiteAngel je 29. jan 2024 ob 08:46 izjavil:
Uf, še veliko dela jih čaka Pa tele groteskne oči Za GOOGL držat nad vodo bo ok.

to so malenkosti...največji preboj jim je že ratal, poglej naprimer kako je bilo z generacijo slik...na začetku leta katastrofalne slike, na koncu pa take, da jih ne moreš ločit od realnosti.. isto bo pri videih..v 3 letih boš imel nekaj minutne videe visoke ločljivosti

Ne, to niso malenkosti. Problem je isti kot pri GPTju. Gre za lepljenje zgeneriranih fragmentov. Zato taka težava s prsti in obrazi. Pri videih zgoraj je očitna težava na robovih skupkov. In to ni enostavno rešljiv problem, ker ti zmanjka računske moči, če želiš razumeti kontekst in narediti video realen. Za nišne reči bo verjetno ok, za efekte, filtre, night clube... Daleč pa od realnega videa.

Karamelo :: 30. jan 2024, 07:43

WhiteAngel je 29. jan 2024 ob 23:26 izjavil:

Karamelo je 29. jan 2024 ob 11:17 izjavil:
WhiteAngel je 29. jan 2024 ob 08:46 izjavil:
Uf, še veliko dela jih čaka Pa tele groteskne oči Za GOOGL držat nad vodo bo ok.

to so malenkosti...največji preboj jim je že ratal, poglej naprimer kako je bilo z generacijo slik...na začetku leta katastrofalne slike, na koncu pa take, da jih ne moreš ločit od realnosti.. isto bo pri videih..v 3 letih boš imel nekaj minutne videe visoke ločljivosti

Ne, to niso malenkosti. Problem je isti kot pri GPTju. Gre za lepljenje zgeneriranih fragmentov. Zato taka težava s prsti in obrazi. Pri videih zgoraj je očitna težava na robovih skupkov. In to ni enostavno rešljiv problem, ker ti zmanjka računske moči, če želiš razumeti kontekst in narediti video realen. Za nišne reči bo verjetno ok, za efekte, filtre, night clube... Daleč pa od realnega videa.

ja no, poglej si razliko v enem letu v generaciji slik naprimer, neverjeten preskok

Vredno ogleda ...

	Tema	Sporočila	Ogledi	Zadnje sporočilo
	Tema	Sporočila	Ogledi	Zadnje sporočilo
»	Microsoft razvil zmogljiv algoritem za posnemanje govora Aggressor Oddelek: Novice / Znanost in tehnologija	10	4790 (3938)	bbf 16. jan 2023 10:11:12
»	Iz navodil generiramo tudi 3D objekte Aggressor Oddelek: Novice / Znanost in tehnologija	7	4576 (3930)	garamond 22. nov 2022 18:29:11
»	Računalnik zna iz navodil generirati video Aggressor Oddelek: Novice / Znanost in tehnologija	8	7665 (6654)	lemur233 11. okt 2022 04:22:36
»	brezplačen video urejevalnik kumer Oddelek: Programska oprema	28	6711 (5902)	opeter 4. nov 2017 10:16:27
»	Izšel LiVES 1.0.0 poweroff Oddelek: Novice / Ostala programska oprema	19	4746 (3444)	poweroff 2. avg 2009 13:06:01

Več podobnih tem

Zadnje novice

Zadnji članki

Išči:

Novice » Ostala programska oprema »
Googlov algoritem Lumiere zna spreminjati slog videa

Googlov algoritem Lumiere zna spreminjati slog videa