Adobe Voco je 'Photoshop za zvok'
Matej Huš
7. nov 2016 ob 21:02:32
Fotografija pove več kot tisoč besed, v modernih časih pa smo se navadili, da tudi kaj neresničnega. Photoshop je pač sinonim za manipulacijo slik, ki ga zna uporabljati slehernik. Podobno je mogoče manipulirati tudi z zvočnimi posnetki, a je to terjalo nekaj več znanja. Nič več. Adobe je na konferenci MAX 2016 pokazal projekt VoCo, ki ga označujejo kot 'Photoshop za zvok'. Z zgolj nekaj kliki omogoča spreminjanje posnetka, tako da ljudem v usta položimo besede ali stavke, ki jih sploh niso nikoli spregovorili.
VoCo (VoiceOvers) je za zdaj še eksperimentalna tehnika, a je Adobe pokazal, da je na visokem nivoju in da se da z njo početi marsikaj, ni pa še znano, če in kdaj bo na voljo za komercialno rabo. Na predstavitvi je Adobov inženir v VoCo uvozil posnetek govora, ki ga je VoCo zlahka prepoznal in prepisal (transkript), potem pa ga je tudi spremenil. Iz "And And uh I kissed my dog and wife" je brez večjih težav nastalo "And uh I kissed Jordan three times". Nekoliko se sicer še sliši, da je posnetek zmontiran, a je rezultat že zelo dober in bo na koncu nedvomno še boljši. Povedali so, da potrebujejo približno 20 minut govorjenega besedila enega človeka, da lahko začnejo ustvarjati nove besede.
Čeprav VoCo komercialno še ni dostopen, so se že pojavili pomisleki. Kakor je Photoshop spremenil dojemanje fotografij, tako grozi, da bo VoCo dojemanje zvočnih posnetkov. Toda napredka se ne da ustaviti, Adobe pa ni edini na tem področju. V podjetju pravijo, da VoCo za zdaj uporabljajo za popravke v podcastih in branih knjigah, ne vemo pa, kaj ponuja prihodnost.