AVSR: zvočno-slikovna prepoznava govora

Ziga Dolhar

28. apr 2003 ob 18:50:04

Audio Visual Speech Recognition se imenuje tehnologija izpod rešetk Intelovega razvojnega laboratorija, ki je bila izdelana v sklopu OpenCV knjižnjice (skupek kode za računalniški vid in prepoznavo obrazov).

Koda je namenjena 'branju z ustnic' in deluje na principu prepoznavanja vizualnih zajemkov izgovorjenih zlogov. Po Intelovih besedah se je metoda izkazala za veliko učinkovitejšo od klasičnih algoritmov za desintezo zvoka, saj je med drugim učinkovita tudi v območjih z visoko stopnjo hrupa. Vseeno pa kanijo tehnologijo uporabiti kot komplement zvočni prepoznavi govora, saj bi obe delovali v navezi; ako bi zvočni alogritem ne uspel pravilno razvozlati povedanega oz. bi bil v dvomih, bi na pomoč priskočil drugi [:)]. Klik!

Ah -- da ne pozabim -- najlepše pri tem pa je to, da je kupček ZlobneKode na voljo pod pogoji open-source licence.