»

Googlov algoritem Lumiere zna spreminjati slog videa

vir: Google
Google - Pri Googlu so razkrili algoritem za generiranje videa Lumiere, ki tako po funkcijah kot prepričljivosti pošteno prekaša obstoječe rešitve.

Strojno ustvarjanje video posnetkov iz besedilnih ukazov sicer (še) ni tako v ospredju kot generatorji slik, saj gre za bistveno zahtevnejše področje, a prav tako napreduje s kar srhljivo naglico. Če smo se jeseni leta 2022 še nasmihali ob sila okornih pojavah na gibljivih sličicah iz Mete in Googla, je že v poldrugem letu situacija zaznavno drugačna, tako glede tehnologije kot razširjenosti. V Meti so lanskega novembra predstavili algoritem Emu, ki naj bi v prihodnje postal pomembno orodje za ustvarjanje vsebin na njihovih družbenih omrežjih. Podobno kot pri slikah, imamo tudi tu kopico izzivalcev, na primer orodje Runway; poleg pa je tudi Stability AI z odprtokodno različico takšnega programja, Stable Video Diffusion. Zvečine gre za kombinirane difuzne modele, ki skušajo glede na navodila najprej zgenerirati posamezne jedrne sličice, ki jih...

9 komentarjev

Google predstavil jezikovni model za glasbo

Slo-Tech - V skladu z Googlovim frontalnim napadom na umetno inteligenco, ki jo želijo uvesti povsod, so ta teden izdali tudi jezikovni model za glasbo. MusicLM, za katerega so še januarja ob tehnični predstavitvi zatrjevali, da javnosti še lep čas ne bo dostopen, je sedaj tu za vsakogar. Za preizkus se je treba registrirati.

MusicLM je na voljo v okviru aplikacije AI Test Kitchen na spletu, iOS ali Androidu. Uporabnikom omogoča, da iz besednih ukazov ustvarijo melodije. Podobno kot vizualni ali besedilni sorodniki je MusicLM tako iznajdljiv, kolikor je prožen ukaz (prompt). Pri ustvarjanju glasbe se obnese najbolje, če želeni rezultat čim bolj opišemo: zvrst in slog, ton, vzdušje, kakšna čustva naj budi itd.

Zanimivo je, da je Google januarja kot glavni pomislek pri hitri izdaji navajal etične izzive in avtorske pravice, saj je model rad vključeval avtorsko zaščitene drobce. A kot kaže, se je Google v sledečih mesecih z glasbeniki in založniki uspel dokopati do rešitve, ki je sprejemljiva....

1 komentar

Google predstavil algoritem za generiranje glasbe

vir: Google
Google - Pri Googlu so pokazali algoritem MusicLM, ki je sposoben iz pisanih navodil ustvarjati večminutne glasbene izdelke, tudi z vokali. Zaenkrat ga ne nameravajo dati na razpolago.

Bliskovit razvoj generativnih algoritmov že sili s področij teksta in podob ter se širi v sfero zvoka. Pri Googlu so zgradili algoritem MusicLM, ki sprejme tekstovna navodila različnih dolžin in natančnosti ter ustvarja glasbo dolžine od pol minute do več minut. Tako je mogoče med drugim odrediti, v kateri žanr naj izdelek spada in katera glasbila naj bodo vključena, pa tudi tematiko, oziroma vzdušje, kot je denimo "vzbujanje izkušnje izgubljenosti v vesolju". Generirati zna tudi vokale, ki pa zaenkrat niso slišati tako pristni kot sama glasba in vsebujejo povsem nesmiselno besedilo. Kot popišejo v spremljevalnem strokovnem članku, MusicLM gradi na obstoječem modelu AudioLM, ki ga je družba predstavila lansko jesen, z nekaj dodatnimi vključki. Princip ni čisto nov in sloni na moderni reprezentaciji zvoka s...

5 komentarjev

Microsoft razvil zmogljiv algoritem za posnemanje govora

Microsoft - V Microsoftu so predstavili algoritem VALL-E, ki zmore oponašati posameznikov glas že zgolj na podlagi 3-sekundnega vzorca. Zaenkrat še ni na razpolago.

Ob aktualni poplavi generativnih algoritmov vizualnih vsebin, ki zmorejo ustvarjati slike, video posnetke in 3D modele, nezadržno napreduje tudi generiranje zvoka, oziroma človeškega govora. Pri Microsoftu so pred tednom dni predstavili takšen algoritem VALL-E, ki zmore pisani tekst pripovedovati z zvenom in emocionalnim patosom osebe, ki mu je predala že zgolj 3-sekundni vzorec svojega govora. Seveda izdelki, ki jih je mogoče slišati na predstavitveni strani, niso brezhibni in ponekod še vedno izpadejo precej robotski, toda kot prototip nove tehnologije algoritem vseeno navduši. Zaradi potenciala za ponarejanje identitete, oziroma zlorabe, ga Microsoft zaenkrat še ne bo spustil iz laboratorijev, podjetje pa je ravno pred dnevi vnovič podrobneje razdelalo svojo strategijo odgovorne rabe strojne inteligence.

VALL-E je sicer...

10 komentarjev

Računalnik zna iz navodil generirati video

vir: Google
Slo-Tech - V Meti in Googlu so predstavili strojno učena algoritma, ki iz pisanih navodil ustvarjata kratke filmčke.

Po tem, ko so algoritmi za generiranje slik iz tekstovnih navodil pošteno razburkali področje strojnega učenja, smo očitno že pri naslednji etapi v razvoju tovrstne umetne inteligence: gibljivih sličicah. Že letos spomladi so takšno programje, CogVideo, pokazali v kitajski raziskovalni skupini z univerze Tsinghua in Pekinške akademije za umetno inteligenco, sedaj pa so se na področje pognali tudi zahodni IT velikani. Najprej je konec septembra Metin laboratorij razkril algoritem Make-A-Video, pred dnevi pa so v Googlu pokazali še podobnega Imagen Video. Oba ustvarjata zelo kratke, petsekundne skupke gibljivih sličic, ki so sicer bolj animacije GIF kot pa resni video posnetki, pa vendarle - kot se je že pohvalil Zuckerberg, gre za novo področje napredka v strojni inteligenci, ki je še za stopnjo višje od generiranja slik iz navodil, in daje tudi primerno osupljive rezultate. S...

8 komentarjev

Google suspendiral inženirja po izjavah, da bi njihov strojni algoritem lahko imel zavest

Blake Lemoine

vir: theguardian.com
theguardian.com - V Googlu so svojega raziskovalca strojne inteligence Blaka Lemoina poslali na plačan dopust, ker je pričel javno opozarjati, da naj bi njihov pogovorni algoritem LaMDA dosegel neko sorto zavesti. Dogodek je znova spodbudil živahno razpravo o tem, če in kdaj utegnejo strojno učeni algoritmi postati neločljivi od človeških sogovornikov.

Na lansko pomlad so pri Googlu pokazali svoj pogovorni strojni algoritem LaMDA, ki je po domače povedano nekakšna različica GPT-3, usmerjena v pogovore. S takšnimi algoritmi namerava podjetje predvsem izboljšati chat bote za pomoč uporabnikom, naročanje in druge podobne storitve. V okviru razvoja imajo tudi oddelek Responsible AI, ki skozi mukotrpne preizkuse preverja, ali se v modele nemara kje zaredijo rasistične nečednosti, diskriminatorni vzorci in podobne tegobe. Eden od inženirjev oddelka je tudi Blake Lemoine, ki je z Lambdo preživel zadnjih šest mesecev - in očitno prišel do zaključka, da se pomenkuje z inteligentno entiteto - oziroma takšno,...

122 komentarjev

Google Music tudi s trgovino

The Verge - Prva javna predstavitev storitve Google Music ni bila ena izmed bolje sprejetih Googlovih stvaritev, predvsem zaradi nekaterih ključnih napak, ki jih je imela za časa beta faze. Sprva je bil Google Music namreč le oblak, ki je uporabnikom omogočal nalaganje do 20.000 skladb in jih v neomejenem številu ponovno prenesti na različne naprave (na osebne računalnike in mobilne naprave z Androidom). Pri tem je bila težava v internetu po ZDA, ki je še vedno edino območje z delujočim Google Music, saj so priključne hitrosti, sploh če gledamo hitrosti od uporabnikov v svet, zelo nizke (nalaganje je bilo torej dolgotrajno opravilo). Obenem je bil uporabniški vmesnik spletne in računalniške (Windows ter Mac OS X) aplikacije vse prej kot odličen, to pa je še dodatno izpostavila izdaja aplikacije za Linux, sprva v precej hroščati obliki.

A stvari se premikajo na bolje, saj je celotna storitev očitno postala stabilna, Google je namreč odstranil oznako Beta, s tem pa tudi izgubila zahtevo po...

20 komentarjev

Google pričel interno testiranje storitve Google Music

vir: CNet
CNet - Google je začel interno preizkušanje prihajajoče storitve Google Music, o kateri smo prvikrat pisali pred poldrugim letom. Prve informacije o tem je prispeval član foruma XDA Developers, ki je na Androidu Honeycomb odkril Google Music. Izkazalo se je, da gre za delujočo verzijo, ki je namenjena internemu testiranju.

Google Music bo uporabnikom omogočala poslušanje glasbe prek vseh naprav, ki bodo povezane v internet (streaming service). Čeprav je bil sprva predviden javni začetek obratovanja storitve že za konec leta 2010, se je zapletlo pri vsebinah. Google se z založniki pogaja o odkupu pravic za hranjenje glasbe v oblaku, pri čemer želijo pridobiti tudi pravice za prenos že...

16 komentarjev