Forum » Programska oprema » Pretvorba govora v tekst
Pretvorba govora v tekst
stegy ::
Ali kdo ve za program, ki bi pretvarjal slovenski govor v tekst?
In obratno?
In obratno?
- spremenil: bluefish ()
bluefish ::
Za pretvorbo teksta v govor je IJS pred leti imel program Govorec, ki je bil na voljo brezplačno.
dunda ::
Iz besedila v govor -> Amebis Govorec
Iz govora v besedilo -> .... obstaja na mariborski računalniški fakulteti, vendar nivo še ni tak, kot pri angleških programih.
Iz govora v besedilo -> .... obstaja na mariborski računalniški fakulteti, vendar nivo še ni tak, kot pri angleških programih.
https://www.kacnje.eu
francek1 ::
Iz besedila v govor -> Amebis Govorec
Iz govora v besedilo -> .... obstaja na mariborski računalniški fakulteti, vendar nivo še ni tak, kot pri angleških programih.
...čeprav ga razvijajo že od leta 1983, ko sem še tam študiral.....
Kdor se je že rodil učen se lahko reži...
dunda ::
Razvoj razpoznave govora je zelo drag. Že sinteza (prej omenjeni Govorec) stane veliko, slovensko govoreči trg pa majhen in kupcev je malo.
Po drugi strani pa se vse bolj bližajo časi, ko bomo z napravami komunicirali z govorom (recimo Google na telefonih). In takrat bosta razpoznava in sinteza govora zelo pomembni.
Samo podjetje Nuance je za razvoj novega programa za razpoznavo vložilo 250 milijončkov. Za Slovenijo nepredstavljiva vsota. Žal.
Po drugi strani pa se vse bolj bližajo časi, ko bomo z napravami komunicirali z govorom (recimo Google na telefonih). In takrat bosta razpoznava in sinteza govora zelo pomembni.
Samo podjetje Nuance je za razvoj novega programa za razpoznavo vložilo 250 milijončkov. Za Slovenijo nepredstavljiva vsota. Žal.
https://www.kacnje.eu
Testman42 ::
Se opravičujem za nekromanijo.
Se je morda v zadnjih treh letih pojavila kakšna rešitev?
Se je morda v zadnjih treh letih pojavila kakšna rešitev?
(\__/) This is Bunny. Copy and paste bunny
(='.'=) into your signature to help him gain
(")_(") world domination.
(='.'=) into your signature to help him gain
(")_(") world domination.
Aston_11 ::
Randomness je izjavil:
Google dela za nas ;-)
To dela že tako dobro, da sms-e pošiljam tako, da mu enostavno povem, kaj naj napiše. In stvar zadene.
dunda ::
Slovenska sinteza govora (TTS) pa se sedaj imenuje eBralec (http://ebralec.si/) (prej Govorec) in je ... precej boljši.
https://www.kacnje.eu
poweroff ::
Razvoj slovenskega jezikovnega modela, ki bi bil 92-96% natančen bi stal okrog pol milijona (ocena iz Danskih izkušenj). Tega denarja žal v Sloveniji ni. Je pa zato denar za TEŠ...
sudo poweroff
Invictus ::
Saj je država vrgla okoli 100 milijonov takratnih tolarjev za razvoj Govorca na IJS.
Samo ne vem kako se je potem znašel v privat rokah...
100 EUR/leto je mal pretirana cena zanj... Zato ga pač nihče ne uporablja.
Moral bi biti pa zastonj s državno podprto ekipo programerjev in jezikoslovcev. Ampak samo v sanjah...
Samo ne vem kako se je potem znašel v privat rokah...
100 EUR/leto je mal pretirana cena zanj... Zato ga pač nihče ne uporablja.
Moral bi biti pa zastonj s državno podprto ekipo programerjev in jezikoslovcev. Ampak samo v sanjah...
"Life is hard; it's even harder when you're stupid."
http://goo.gl/2YuS2x
http://goo.gl/2YuS2x
Zgodovina sprememb…
- spremenil: Invictus ()
Mare2 ::
Bi bilo res fino, zdiktiraš, računalnik pa tipka. :) Torej, a je že kaj takega ali ni? :)
http://bit.ly/Navodilo123 Podpora za N26 Mastercard za Slovenijo
poweroff ::
Ja, dela super, ampak je Google. Po moje bi rabili LASTEN, ne-oblačni in odprtokodni sistem. Eni recimo celo laufajo na Raspberryu.
Invictus: bluziš na polno.
Država je v razvoj Govorca vrgla 2,3 milijona evrov in ne 100 milijonov. Problem je, ker so v projekt tudi zasebne firme vložile kar nekaj lastnega denarja, zato si ga sedaj delno lastijo. Se pa na IJS moji sodelavci, ki so delali na tem projektu strinjajo, da bi moral biti projekt v celoti odprtokoden.
Mimogrede, prepoznava vnaprej določenih oseb z zamejenim vokabularjem sicer precej dobro deluje (do 97% pravilnost). Problem je prepoznava naključnega govora "iz ulice".
Pa še nekaj - tisto, kar so razvijali, je bilo 15 let nazaj. Od takrat poznamo nove algoritme (deep machine learning), ki delajo precej drugače. Zato bi bilo treba določene zadeve razviti na novo.
Invictus: bluziš na polno.
Država je v razvoj Govorca vrgla 2,3 milijona evrov in ne 100 milijonov. Problem je, ker so v projekt tudi zasebne firme vložile kar nekaj lastnega denarja, zato si ga sedaj delno lastijo. Se pa na IJS moji sodelavci, ki so delali na tem projektu strinjajo, da bi moral biti projekt v celoti odprtokoden.
Mimogrede, prepoznava vnaprej določenih oseb z zamejenim vokabularjem sicer precej dobro deluje (do 97% pravilnost). Problem je prepoznava naključnega govora "iz ulice".
Pa še nekaj - tisto, kar so razvijali, je bilo 15 let nazaj. Od takrat poznamo nove algoritme (deep machine learning), ki delajo precej drugače. Zato bi bilo treba določene zadeve razviti na novo.
sudo poweroff
M & M ::
Ja, dela super, ampak je Google. Po moje bi rabili LASTEN, ne-oblačni in odprtokodni sistem. Eni recimo celo laufajo na Raspberryu.
Za Raspberry Pi sem se imel namen malo igrat s tem: http://jasperproject.github.io/ ... ampak še ni bilo časa :)
diler515 ::
zakaj raje ne naredijo da se program sam uci tako kot otrok, potem bi stvar delovala za vse jezike.....
btw, kako dalec je da bo racunalnik znal prepoznati vsebino govora, recimo recem "ej, dj preveri ce sem ze dobil odgovor na email punci ki sva ga poslala vceraj, povej kaj je odgovorila, ce laze ji shekaj mail in poslji vsem ki jih pozna najin sex tape, ce ne more ker ji sef ni odobril dopusta uredi se zmeni z njim (lahko tudi na grd nacin), ce lahko se zmeni vse potrebno, ce je kaj drugega mi ga pa preberi.... umes mi pa se naroci pico pa da loadat najnovejsi del nadaljevanke xy" "gospod, sem že dobil mail ko vas ni blo, res je sef ni hotel pustit na dopust, ampak njegova zamenjava je bila drugacnega mnenja (vdrl sem v njegov avto in se z 200 km/h zapeljal v betonski zid), nadaljevanko sem vam ze zloadal, 4k verzijo, pica pa je tudi ze narocena... pride cez 10 min, nadaljevanko vam bom predvajal v dnevni sobi, samo ce lahko komentiram se mi zdi slab del"
btw, kako dalec je da bo racunalnik znal prepoznati vsebino govora, recimo recem "ej, dj preveri ce sem ze dobil odgovor na email punci ki sva ga poslala vceraj, povej kaj je odgovorila, ce laze ji shekaj mail in poslji vsem ki jih pozna najin sex tape, ce ne more ker ji sef ni odobril dopusta uredi se zmeni z njim (lahko tudi na grd nacin), ce lahko se zmeni vse potrebno, ce je kaj drugega mi ga pa preberi.... umes mi pa se naroci pico pa da loadat najnovejsi del nadaljevanke xy" "gospod, sem že dobil mail ko vas ni blo, res je sef ni hotel pustit na dopust, ampak njegova zamenjava je bila drugacnega mnenja (vdrl sem v njegov avto in se z 200 km/h zapeljal v betonski zid), nadaljevanko sem vam ze zloadal, 4k verzijo, pica pa je tudi ze narocena... pride cez 10 min, nadaljevanko vam bom predvajal v dnevni sobi, samo ce lahko komentiram se mi zdi slab del"
Mare2 ::
diler, tega še jaz nisem dobro razumel. :)
http://bit.ly/Navodilo123 Podpora za N26 Mastercard za Slovenijo
dunda ::
Saj je država vrgla okoli 100 milijonov takratnih tolarjev za razvoj Govorca na IJS.
Samo ne vem kako se je potem znašel v privat rokah...
100 EUR/leto je mal pretirana cena zanj... Zato ga pač nihče ne uporablja.
Moral bi biti pa zastonj s državno podprto ekipo programerjev in jezikoslovcev. Ampak samo v sanjah...
Iz prve in druge roke lahko povem, da je večina tistih "privat" (verjetno kar vsi), ki so zadevo v resnici delali, od tega denarja videla le kakšno drobtinico.
Kar je - glede na veliko vloženega dela - precej smešno. Je pa denar za kup nepotrebnih raziskav, ki so same sebi namen.
https://www.kacnje.eu
poweroff ::
zakaj raje ne naredijo da se program sam uci tako kot otrok, potem bi stvar delovala za vse jezike.....
Joj, kakšno bluzeje.
Saj to se dela. Algoritmi za to so. Ampak problem je trening. Po domače - razvoj jezikovnega modela.
To pa pač stane in zahteva določeno delo.
sudo poweroff
poweroff ::
Mimogrede, Microsoft je te dni naredil pomemben breakthrough: WER (word error rate) imajo 5,9%. To je primerljivo s človeškim razumevanjem.
Žal samo za angleški jezik.
Žal samo za angleški jezik.
sudo poweroff
Spiky28 ::
Jaz bi iskoristil temo za vprašanje oz. predlog.
text-to-speech iščem. Bolj kot ne bi rabil za 'branje' spletnih strani.
Najraje bi imel plugin za firefox, ampak nisem nič pametnega našel.
Kakšni predlogi?
ps. sem zdaj prebral, da bi firefox naj imel 'narrate' gumb v reader načinu. ampak pri meni tega gumba ni.
text-to-speech iščem. Bolj kot ne bi rabil za 'branje' spletnih strani.
Najraje bi imel plugin za firefox, ampak nisem nič pametnega našel.
Kakšni predlogi?
ps. sem zdaj prebral, da bi firefox naj imel 'narrate' gumb v reader načinu. ampak pri meni tega gumba ni.
Laki_ laik ::
Vem da je starrjša tema pa bi vseeno vprašal.Ali obstaja kak program v rangu nuance dragon progessional in da podpira slovenski jezik ter funkcionira vsaj približno tako kot dragon.Videl sempri zdravniku da diktira in potem takoj natisne tako da najbrž obstaja kak program ker ga zdravniki uporabljajo.
Netrunner ::
Pri katerem zdravniku si to videl? Lani v UKC-MB so še vsi zdravniki imeli diktafone na one male kasete.
Doing nothing is very hard to do... you never know when you're finished.
nergac ::
Super.
I am from Slovenia.
I am from Slovakia.
I am from Slavonia.
Prej bom dočakal človeka na marsu ... V kriogenem stanju.
Zdaj pa ne vem, če bo to Živadinov ali bom kar sam.
I am from Slovenia.
I am from Slovakia.
I am from Slavonia.
Prej bom dočakal človeka na marsu ... V kriogenem stanju.
Zdaj pa ne vem, če bo to Živadinov ali bom kar sam.
harvey ::
Super.
I am from Slovenia.
I am from Slovakia.
I am from Slavonia.
Prej bom dočakal človeka na marsu ... V kriogenem stanju.
Zdaj pa ne vem, če bo to Živadinov ali bom kar sam.
SRC nudi te rešitve že dlje časa za slo zdravstvene ustanove.
V Sloveniji smo prve uspešne implementacije s črtno kodo izvedli konec leta 2011 (DC Bled, Zdravstvo Rogaška, BGP Kranj), v začetku letošnjega leta je sledila uvedba v SB Celje, v delu je implementacija v UKC Ljubljana kot največji in najpomembnejši slovenski zdravstveni ustanovi
vir - https://infosrc.wordpress.com/2012/06/1...
Ar scáth a chéile a mhaireann na daoine.
------
------
nergac ::
Se opravičujem in posipam s pepelom.
Mislim pa da je glavna težava majhen trg.
Pa pogovorni jezik ... Slovenščina je še najbolj pogovorna v Celju in okolici, ostalo so že posebnosti pokrajin.
Mislim pa da je glavna težava majhen trg.
Pa pogovorni jezik ... Slovenščina je še najbolj pogovorna v Celju in okolici, ostalo so že posebnosti pokrajin.
andmer99 ::
Laki_ laik je izjavil:
Vem da je starrjša tema pa bi vseeno vprašal.Ali obstaja kak program v rangu nuance dragon progessional in da podpira slovenski jezik ter funkcionira vsaj približno tako kot dragon.Videl sempri zdravniku da diktira in potem takoj natisne tako da najbrž obstaja kak program ker ga zdravniki uporabljajo.
Kar si videl, je dejansko skoraj to, kar si že sam ugotovil in kar so potem omenili drugi tukaj pred mano. Uporabljajo zadevo tudi v UKC MB, vendar ne vsi zdravniki, temveč tisti na radiologiji (do zakaj še pridemo). Postavitev sistema je SRCjeva, saj je tukaj glavna funkcija z vidika zdravnikov predvsem dostop/obdelava medicinskih slik, narekovanje je samo "bonbonček". Za razpoznavanje nareka zdravnika v besedilo skrbi Nuance Dragon Medical razpoznavalnik govor (oz. bivši Philips SpeechMagic, ker ne vem, če so nadgrajevali prve verzije), ki podpira tudi slovenščino.
Da zadeva tako dobro funkcionira za slovenščino so zaslužni predvsem trije faktorji:
1.) podprto je samo narekovanje medicinskega besedišča, oz. še ožje, samo radiologije. Če mu boš začel narekovati neko splošno besedilo, bo rezultat bistveno slabši. Za nekatere jezike obstaja tudi Nuance Dragon Legal, ki podpira pravno besedišče, nimam pa 100% informacije ali je med njimi tudi slovenščina - naj bi bila.
2.) sistem je adaptiran na konkretnega govorca, če bi govoril kar nekdo x-ti, je rezultat slabši.
3.) za zajem govora uporabljajo specialni mikrofon Philips SpeechMike, ki je namenjen narekovanju (cena ~500USD) in kar dobro spredprocesira zajeti govorni signal. Hkrati ima tudi funkcijo push-to-talk, tako da se razpoznavalnik govora ne rabi "ukvarjati" z ugotavljanjem začetka in konca.
Ni pa to edini komercialni razpoznavalnik govora, ki podpira slovenščino. Google Speech API ima že kar nekaj let vključeno podporo za slovenski jezik. Tukaj gre za razpoznavalnik govora za splošno besedilo. Vsaj na začetku tudi ne uporablja adaptacije na konkretnega govorca, sem pa prepričan da se s časom tudi adaptira na vsakega uporabnika - drugače ne bi bil Google. Rezultati z njim niso slabi, se pa zaradi zgornjih treh razlogov seveda ne morejo primerjati z Nuance Dragon Medical. Sicer pa to tudi ni njegov namen.
Delovanje Google Speech API razpoznavalnika za slovenščino lahko online stestiraš na tem demotu (rabiš sicer Chrome):
https://www.google.com/intl/en/chrome/d...
Uporablja pa ga tudi tale online voice notepad (spet rabiš Chrome):
https://dictation.io/speech
Po nekaterih informacijah, so Google Speech API nekaj časa uporabljali tudi za razpoznavanje govora pri Telekomovem Neotu, ali je še tako, pa ne vem.
Se pa zadnje leto po vzoru tujine na tem področju raziskovalno/razvojno dogaja tudi v Sloveniji. Teče namreč projekt Razvoj slovenščine v digitalnem okolju, kjer je cilj zagotoviti prosto dostopne rešitve za govorne tehnologije v slovenščini, med njimi tudi razpoznavalnik govora. Več info je tukaj:
https://www.cjvt.si/rsdo/
andmer99 ::
Super.
I am from Slovenia.
I am from Slovakia.
I am from Slavonia.
Prej bom dočakal človeka na marsu ... V kriogenem stanju.
Zdaj pa ne vem, če bo to Živadinov ali bom kar sam.
Ta Slovakia/Slovenia/Slavonia primer je za razpoznavalnik govora kar zloben. Še posebej, če govorčev materin jezik ni angleščina.
Sem pa sedaj prvič probal ta primer z dictation.io (Google speech API US English), pa mi začuda vse razpozna 100%! Pa je moja angleščina kar lepo "slovanska". Razpoznavanje govora je v zadnjih 10 letih naredilo velik korak naprej na račun nevronskih mrež in pa big data pristopa, tako da se to pozna tudi pri takšnih zagonetnih primerih.
Torej te je Google v kriogenem stanju poslal na Mars - prijetno potovanje ;-)
PS: Ali pa Google speech API najprej detektira slovansko angleščino, potem pa vklopi specialni dodatni modul za razpoznavanja stavkov "I am from [some Slavic shithole]"....
PPS: upam, da sem prinesel par novih informacij v to staro temo.
Vredno ogleda ...
Tema | Ogledi | Zadnje sporočilo | |
---|---|---|---|
Tema | Ogledi | Zadnje sporočilo | |
» | Slovenski sintetizator govora eBralecOddelek: Programska oprema | 6743 (2931) | Irbis |
» | Program za pretvorbo govora v tekstOddelek: Loža | 4649 (4217) | ToniT |
» | Glasovno upravljanje telefona v slovenščini - androidOddelek: Mobilne tehnologije | 5845 (5252) | dunda |
» | Prepoznavanje govoraOddelek: Programska oprema | 7471 (5096) | Blop |
» | Prepoznavanje zvoka in predvajanje MP3 v C++ ali DelphijuOddelek: Programiranje | 2943 (2655) | Thomas |