» »

Microsoft razvil zmogljiv algoritem za posnemanje govora

Microsoft razvil zmogljiv algoritem za posnemanje govora

Microsoft - V Microsoftu so predstavili algoritem VALL-E, ki zmore oponašati posameznikov glas že zgolj na podlagi 3-sekundnega vzorca. Zaenkrat še ni na razpolago.

Ob aktualni poplavi generativnih algoritmov vizualnih vsebin, ki zmorejo ustvarjati slike, video posnetke in 3D modele, nezadržno napreduje tudi generiranje zvoka, oziroma človeškega govora. Pri Microsoftu so pred tednom dni predstavili takšen algoritem VALL-E, ki zmore pisani tekst pripovedovati z zvenom in emocionalnim patosom osebe, ki mu je predala že zgolj 3-sekundni vzorec svojega govora. Seveda izdelki, ki jih je mogoče slišati na predstavitveni strani, niso brezhibni in ponekod še vedno izpadejo precej robotski, toda kot prototip nove tehnologije algoritem vseeno navduši. Zaradi potenciala za ponarejanje identitete, oziroma zlorabe, ga Microsoft zaenkrat še ne bo spustil iz laboratorijev, podjetje pa je ravno pred dnevi vnovič podrobneje razdelalo svojo strategijo odgovorne rabe strojne inteligence.

VALL-E je sicer zasnovan na tehnologiji EnCodec, ki so jo lansko jesen predstavili v Meti in je v osnovi sicer namenjena naprednemu stiskanju zvoka, z desetkrat višjo stopnjo kompresije od standarda MP3. Tako se izziva oponašanja govora loti iz samosvoje smeri; medtem ko običajni pristopi iz teksta generiran govor nakdnadno prilagajajo določeni osebi s spreminjanjem tonov in zvena, pa VALL-E štarta iz informacij, "zapakiranih" v skompresirane žetone EnCodeca. Kakor Microsoftovi inženirji razložijo v strokovnem članku, so model trenirali na Metini knjižnici LibriLight, ki vsebuje za 60.000 ur angleškega govora nekaj čez 7000 oseb. Rezultat algoritma je najboljši, če oseba govori podobno kot kateri izmed govorcev v tej bazi podatkov.

10 komentarjev

Karamelo ::

kot da JJ še nima dovolj oponašalcev :)

XIIT ::

'Believe nothing you hear, and only one half that you see.' -- Edgar Allan Poe
"Only physical beauty is the foundation for a true higher culture of
the mind and spirit as well. Only sun and steel will show you the path."
Beauty is absolutely terrifying to people because it highlights what is ugly.

Mr.B ::

Ameriški naglas indijske MS podpore.
France Rejects Genocide Accusations Against Israel in Gaza,
To accuse the Jewish state of genocide is to cross a moral threshold

nejcek74 ::

Mr.B je izjavil:

Ameriški naglas indijske MS podpore.

Indijski naglas ameriške MS podpore?

Mr.B ::

nejcek74 je izjavil:

Mr.B je izjavil:

Ameriški naglas indijske MS podpore.

Indijski naglas ameriške MS podpore?

Obe opicje so možno. Bodo že vedeli s kom govorijo in koga je volil, ter temu priredili naglas.
France Rejects Genocide Accusations Against Israel in Gaza,
To accuse the Jewish state of genocide is to cross a moral threshold

Karamelo ::

svet gre v smeri da vsrkava vse možne medije, zdaj pa šok, da so vse vsebine medijev (zvok, slika, video) lahko fake

FastWIND ::

Fake World.

_Denny_ ::

Problemi bodo predvsem v obratni smeri, ko se bodo pojavili pristni posnetki svinjarij, ki bodo potem označeni kot ponaredki. Priljubljen filmski igralec, pevec ali politik že ni storil ali rekel tega, čisto vse je fake.
Asrock X670E Taichi, Ryzen 9 7950X3D + NH-D14, 96GB Corsair DDR5-6400 CL32
RTX 2070S 8GB, 2TB Kingston KC3000, 2TB ADATA SX8200 Pro, 4TB Micron 5200
Seasonic Focus Plus 850W, Corsair Air 540, Logitech Z-2300, Samsung UE65H6400

Karamelo ::

v bistvu bomo ljudje nehali dajati neko težo na te informacije v obliki slik, videov in zvoka. vprašanje je samo, kako bomo prišli do pravih informacij - ali se bo pojavil kak nov vir informacij oz. nova oblika

bbf ::

Karamelo je izjavil:

v bistvu bomo ljudje nehali dajati neko težo na te informacije v obliki slik, videov in zvoka. vprašanje je samo, kako bomo prišli do pravih informacij - ali se bo pojavil kak nov vir informacij oz. nova oblika

Možnosti so, ampak verjetno se to ne bo zgodilo. Ko te enkrat novičarstvo nategne, jim ne boš več zaupal. Verjel.. mogoče. Zaupal.. nikoli!


Vredno ogleda ...

TemaSporočilaOglediZadnje sporočilo
TemaSporočilaOglediZadnje sporočilo
»

Kaj smo videli na CES-u (strani: 1 2 )

Oddelek: Novice / Znanost in tehnologija
5217260 (13662) MrStein
»

Kurzweil o projektu Google AI (strani: 1 2 3 )

Oddelek: Novice / Znanost in tehnologija
13025037 (21447) jype
»

Nov članek: Mnenje - Patentiranje programsko izvedenih izumov - da ali ne?

Oddelek: Novice / Nova vsebina
423629 (2865) kriko1
»

Desktop aplikacije večinoma niso multithreaded??? (strani: 1 2 )

Oddelek: Programiranje
554639 (3885) Gundolf

Več podobnih tem