Nvidiin jezikovni model za zvoke: Fugatto
Slo-Tech - Nvidia je predstavil novo orodje za ustvarjanje glasbe, ki deluje kot jezikovni model umetne inteligence. Fugatto (Foundational Generative Audio Transformer Opus 1) - napovednik res vsebuje sliko mačka - omogoča besedilni opis zvoka ali zvokov, ki jih želimo poustvariti, nato pa jih Fugatto zaigra. Nvidia ob tem poudarja, da je to prvi model, ki omogoča povsem nove in doslej nikoli slišane vrste zvokov. To je seveda precej drzna trditev, saj nekaj podobnega počnejo tudi drugi tovrstni modeli. Po drugi strani pa lahko Fugatto uporabimo za ustvarjanje povsem običajnih zvokov, ki jih potrebujemo v kakršnikoli produkciji, denimo zvok troblje na vlaku, ki se počasi prelije v igranje simfoničnega orkestra.
Druga možnost je uporaba za predelavo zvočnih posnetkov. Fugatto lahko obdelavo posnetek skladbe in - če mu tako naročimo z besedami - izolira vokal ali kakšen instrument. Lahko pa orodju naročimo, da v posnetek doda kakšen instrument. Spremeniti je možno tudi modulacijo, denimo jezni glas v prijetnega ipd. Ozadje, kolikor so ga smeli razkriti, so opisali v znanstvenem članku, kjer so Fugatto primerjali tudi z drugimi tovrstnimi modeli. Ni namreč edini ali prvi, saj je konkurenca (Stability AI, OpenAI, Google DeepMind,...
Druga možnost je uporaba za predelavo zvočnih posnetkov. Fugatto lahko obdelavo posnetek skladbe in - če mu tako naročimo z besedami - izolira vokal ali kakšen instrument. Lahko pa orodju naročimo, da v posnetek doda kakšen instrument. Spremeniti je možno tudi modulacijo, denimo jezni glas v prijetnega ipd. Ozadje, kolikor so ga smeli razkriti, so opisali v znanstvenem članku, kjer so Fugatto primerjali tudi z drugimi tovrstnimi modeli. Ni namreč edini ali prvi, saj je konkurenca (Stability AI, OpenAI, Google DeepMind,...