Pretvorba govora v tekst @ Slo-Tech

Forum » Programska oprema »
Pretvorba govora v tekst

Pretvorba govora v tekst

stegy :: 17. nov 2013, 22:57

Ali kdo ve za program, ki bi pretvarjal slovenski govor v tekst?

In obratno?

spremenil: bluefish (17. nov 2013 ob 22:58)

iloveboobz :: 17. nov 2013, 22:58

bi se našlo kej, sam rezultati nebojo nwm kaj.

smoki

bluefish :: 17. nov 2013, 22:58

Za pretvorbo teksta v govor je IJS pred leti imel program Govorec, ki je bil na voljo brezplačno.

Mipe :: 17. nov 2013, 23:04

Na Youtube ga imajo, vendar je praktično neuporaben.

dunda :: 18. nov 2013, 05:03

Iz besedila v govor -> Amebis Govorec
Iz govora v besedilo -> .... 8-O

obstaja na mariborski računalniški fakulteti, vendar nivo še ni tak, kot pri angleških programih.

https://www.kacnje.eu

francek1 :: 18. nov 2013, 05:40

dunda je 18. nov 2013 ob 05:03 izjavil:

Iz besedila v govor -> Amebis Govorec
Iz govora v besedilo -> .... obstaja na mariborski računalniški fakulteti, vendar nivo še ni tak, kot pri angleških programih.

...čeprav ga razvijajo že od leta 1983, ko sem še tam študiral.....

Kdor se je že rodil učen se lahko reži...

dunda :: 18. nov 2013, 05:47

Razvoj razpoznave govora je zelo drag. Že sinteza (prej omenjeni Govorec) stane veliko, slovensko govoreči trg pa majhen in kupcev je malo.
Po drugi strani pa se vse bolj bližajo časi, ko bomo z napravami komunicirali z govorom (recimo Google na telefonih). In takrat bosta razpoznava in sinteza govora zelo pomembni.

Samo podjetje Nuance je za razvoj novega programa za razpoznavo vložilo 250 milijončkov. Za Slovenijo nepredstavljiva vsota. Žal.

https://www.kacnje.eu

Testman42 :: 17. okt 2016, 15:45

Se opravičujem za nekromanijo.

Se je morda v zadnjih treh letih pojavila kakšna rešitev?

(\__/) This is Bunny. Copy and paste bunny
(='.'=) into your signature to help him gain
(")_(") world domination.

Randomness :: 17. okt 2016, 21:21

Google dela za nas ;-)

harvey :: 17. okt 2016, 21:48

Dictation.io

offline program - Dragon od Nuance

Ar scáth a chéile a mhaireann na daoine.
------

Zgodovina sprememb…

spremenil: harvey (17. okt 2016 ob 21:52)

Aston_11 :: 17. okt 2016, 21:55

Randomness je 17. okt 2016 ob 21:21 izjavil:

Google dela za nas ;-)

To dela že tako dobro, da sms-e pošiljam tako, da mu enostavno povem, kaj naj napiše. In stvar zadene.

dunda :: 18. okt 2016, 13:59

Slovenska sinteza govora (TTS) pa se sedaj imenuje eBralec (http://ebralec.si/) (prej Govorec) in je ... precej boljši.

https://www.kacnje.eu

poweroff :: 18. okt 2016, 14:16

Razvoj slovenskega jezikovnega modela, ki bi bil 92-96% natančen bi stal okrog pol milijona (ocena iz Danskih izkušenj). Tega denarja žal v Sloveniji ni. Je pa zato denar za TEŠ...

sudo poweroff

Invictus :: 18. okt 2016, 15:06

Saj je država vrgla okoli 100 milijonov takratnih tolarjev za razvoj Govorca na IJS.

Samo ne vem kako se je potem znašel v privat rokah...

100 EUR/leto je mal pretirana cena zanj... Zato ga pač nihče ne uporablja.

Moral bi biti pa zastonj s državno podprto ekipo programerjev in jezikoslovcev. Ampak samo v sanjah...

"Life is hard; it's even harder when you're stupid."

http://goo.gl/2YuS2x

Zgodovina sprememb…

spremenil: Invictus (18. okt 2016 ob 15:07)

Mare2 :: 18. okt 2016, 17:26

Bi bilo res fino, zdiktiraš, računalnik pa tipka. :) Torej, a je že kaj takega ali ni? :)

M & M :: 18. okt 2016, 17:52

Je, v https://docs.google.com in na https://dictation.io/
Za oboje rabiš Chrome. Dela OK.

poweroff :: 18. okt 2016, 20:32

Ja, dela super, ampak je Google. Po moje bi rabili LASTEN, ne-oblačni in odprtokodni sistem. Eni recimo celo laufajo na Raspberryu.

Invictus: bluziš na polno.

Država je v razvoj Govorca vrgla 2,3 milijona evrov in ne 100 milijonov. Problem je, ker so v projekt tudi zasebne firme vložile kar nekaj lastnega denarja, zato si ga sedaj delno lastijo. Se pa na IJS moji sodelavci, ki so delali na tem projektu strinjajo, da bi moral biti projekt v celoti odprtokoden.

Mimogrede, prepoznava vnaprej določenih oseb z zamejenim vokabularjem sicer precej dobro deluje (do 97% pravilnost). Problem je prepoznava naključnega govora "iz ulice".

Pa še nekaj - tisto, kar so razvijali, je bilo 15 let nazaj. Od takrat poznamo nove algoritme (deep machine learning), ki delajo precej drugače. Zato bi bilo treba določene zadeve razviti na novo.

sudo poweroff

amacar :: 18. okt 2016, 20:42

Sej je napisal v tolarjih, kar je cca 0.5mio €.

M & M :: 18. okt 2016, 23:31

poweroff je 18. okt 2016 ob 20:32 izjavil:

Ja, dela super, ampak je Google. Po moje bi rabili LASTEN, ne-oblačni in odprtokodni sistem. Eni recimo celo laufajo na Raspberryu.

Za Raspberry Pi sem se imel namen malo igrat s tem: http://jasperproject.github.io/ ... ampak še ni bilo časa :)

diler515 :: 19. okt 2016, 01:20

zakaj raje ne naredijo da se program sam uci tako kot otrok, potem bi stvar delovala za vse jezike.....

btw, kako dalec je da bo racunalnik znal prepoznati vsebino govora, recimo recem "ej, dj preveri ce sem ze dobil odgovor na email punci ki sva ga poslala vceraj, povej kaj je odgovorila, ce laze ji shekaj mail in poslji vsem ki jih pozna najin sex tape, ce ne more ker ji sef ni odobril dopusta uredi se zmeni z njim (lahko tudi na grd nacin), ce lahko se zmeni vse potrebno, ce je kaj drugega mi ga pa preberi.... umes mi pa se naroci pico pa da loadat najnovejsi del nadaljevanke xy" "gospod, sem že dobil mail ko vas ni blo, res je sef ni hotel pustit na dopust, ampak njegova zamenjava je bila drugacnega mnenja (vdrl sem v njegov avto in se z 200 km/h zapeljal v betonski zid), nadaljevanko sem vam ze zloadal, 4k verzijo, pica pa je tudi ze narocena... pride cez 10 min, nadaljevanko vam bom predvajal v dnevni sobi, samo ce lahko komentiram se mi zdi slab del"

Mare2 :: 19. okt 2016, 02:20

diler, tega še jaz nisem dobro razumel. :)

diler515 :: 19. okt 2016, 02:48

se pravi nic free sample zate (sry pisem na touch screenu + na pol spim)

dunda :: 19. okt 2016, 04:52

Invictus je 18. okt 2016 ob 15:06 izjavil:

Saj je država vrgla okoli 100 milijonov takratnih tolarjev za razvoj Govorca na IJS.
Samo ne vem kako se je potem znašel v privat rokah...
100 EUR/leto je mal pretirana cena zanj... Zato ga pač nihče ne uporablja.
Moral bi biti pa zastonj s državno podprto ekipo programerjev in jezikoslovcev. Ampak samo v sanjah...

Iz prve in druge roke lahko povem, da je večina tistih "privat" (verjetno kar vsi), ki so zadevo v resnici delali, od tega denarja videla le kakšno drobtinico.
Kar je - glede na veliko vloženega dela - precej smešno. Je pa denar za kup nepotrebnih raziskav, ki so same sebi namen.

https://www.kacnje.eu

poweroff :: 19. okt 2016, 10:05

diler515 je 19. okt 2016 ob 01:20 izjavil:

zakaj raje ne naredijo da se program sam uci tako kot otrok, potem bi stvar delovala za vse jezike.....

Joj, kakšno bluzeje.

Saj to se dela. Algoritmi za to so. Ampak problem je trening. Po domače - razvoj jezikovnega modela.

To pa pač stane in zahteva določeno delo.

sudo poweroff

dunda :: 20. okt 2016, 05:12

Primer govora eBralca:

https://www.kacnje.eu

poweroff :: 20. okt 2016, 11:46

Mimogrede, Microsoft je te dni naredil pomemben breakthrough: WER (word error rate) imajo 5,9%. To je primerljivo s človeškim razumevanjem.

Žal samo za angleški jezik.

sudo poweroff

bluefish :: 20. okt 2016, 18:06

Še novica, če ne bo spisana: https://www.neowin.net/news/microsoft-m...

technolog :: 15. nov 2016, 21:50

https://cloud.google.com/speech/

Spodaj izberete "Slovenščina" in stisnete mikrofon.

Spiky28 :: 19. nov 2016, 15:31

Jaz bi iskoristil temo za vprašanje oz. predlog.
text-to-speech iščem. Bolj kot ne bi rabil za 'branje' spletnih strani.
Najraje bi imel plugin za firefox, ampak nisem nič pametnega našel.

Kakšni predlogi?

ps. sem zdaj prebral, da bi firefox naj imel 'narrate' gumb v reader načinu. ampak pri meni tega gumba ni.

dunda :: 19. nov 2016, 15:56

Poglej tale primer, če ti kaj pomaga.
Za TTS pa seveda eBralec.

https://www.kacnje.eu

Laki_ laik :: 9. dec 2020, 21:58

Vem da je starrjša tema pa bi vseeno vprašal.Ali obstaja kak program v rangu nuance dragon progessional in da podpira slovenski jezik ter funkcionira vsaj približno tako kot dragon.Videl sempri zdravniku da diktira in potem takoj natisne tako da najbrž obstaja kak program ker ga zdravniki uporabljajo.

Netrunner :: 9. dec 2020, 22:09

Pri katerem zdravniku si to videl? Lani v UKC-MB so še vsi zdravniki imeli diktafone na one male kasete.

Doing nothing is very hard to do... you never know when you're finished.

nergac :: 9. dec 2020, 22:11

Super.

I am from Slovenia.
I am from Slovakia.
I am from Slavonia.

Prej bom dočakal človeka na marsu ... V kriogenem stanju.

Zdaj pa ne vem, če bo to Živadinov ali bom kar sam.

harvey :: 9. dec 2020, 22:23

nergac je 9. dec 2020 ob 22:11 izjavil:

Super.

I am from Slovenia.
I am from Slovakia.
I am from Slavonia.

Prej bom dočakal človeka na marsu ... V kriogenem stanju.

Zdaj pa ne vem, če bo to Živadinov ali bom kar sam.

SRC nudi te rešitve že dlje časa za slo zdravstvene ustanove.

V Sloveniji smo prve uspešne implementacije s črtno kodo izvedli konec leta 2011 (DC Bled, Zdravstvo Rogaška, BGP Kranj), v začetku letošnjega leta je sledila uvedba v SB Celje, v delu je implementacija v UKC Ljubljana kot največji in najpomembnejši slovenski zdravstveni ustanovi
vir - https://infosrc.wordpress.com/2012/06/1...

Ar scáth a chéile a mhaireann na daoine.
------

nergac :: 9. dec 2020, 22:31

Se opravičujem in posipam s pepelom.

Mislim pa da je glavna težava majhen trg.

Pa pogovorni jezik ... Slovenščina je še najbolj pogovorna v Celju in okolici, ostalo so že posebnosti pokrajin.

andmer99 :: 9. dec 2020, 23:40

Laki_ laik je 9. dec 2020 ob 21:58 izjavil:

Vem da je starrjša tema pa bi vseeno vprašal.Ali obstaja kak program v rangu nuance dragon progessional in da podpira slovenski jezik ter funkcionira vsaj približno tako kot dragon.Videl sempri zdravniku da diktira in potem takoj natisne tako da najbrž obstaja kak program ker ga zdravniki uporabljajo.

Kar si videl, je dejansko skoraj to, kar si že sam ugotovil in kar so potem omenili drugi tukaj pred mano. Uporabljajo zadevo tudi v UKC MB, vendar ne vsi zdravniki, temveč tisti na radiologiji (do zakaj še pridemo). Postavitev sistema je SRCjeva, saj je tukaj glavna funkcija z vidika zdravnikov predvsem dostop/obdelava medicinskih slik, narekovanje je samo "bonbonček". Za razpoznavanje nareka zdravnika v besedilo skrbi Nuance Dragon Medical razpoznavalnik govor (oz. bivši Philips SpeechMagic, ker ne vem, če so nadgrajevali prve verzije), ki podpira tudi slovenščino.

Da zadeva tako dobro funkcionira za slovenščino so zaslužni predvsem trije faktorji:
1.) podprto je samo narekovanje medicinskega besedišča, oz. še ožje, samo radiologije. Če mu boš začel narekovati neko splošno besedilo, bo rezultat bistveno slabši. Za nekatere jezike obstaja tudi Nuance Dragon Legal, ki podpira pravno besedišče, nimam pa 100% informacije ali je med njimi tudi slovenščina - naj bi bila.
2.) sistem je adaptiran na konkretnega govorca, če bi govoril kar nekdo x-ti, je rezultat slabši.
3.) za zajem govora uporabljajo specialni mikrofon Philips SpeechMike, ki je namenjen narekovanju (cena ~500USD) in kar dobro spredprocesira zajeti govorni signal. Hkrati ima tudi funkcijo push-to-talk, tako da se razpoznavalnik govora ne rabi "ukvarjati" z ugotavljanjem začetka in konca.

Ni pa to edini komercialni razpoznavalnik govora, ki podpira slovenščino. Google Speech API ima že kar nekaj let vključeno podporo za slovenski jezik. Tukaj gre za razpoznavalnik govora za splošno besedilo. Vsaj na začetku tudi ne uporablja adaptacije na konkretnega govorca, sem pa prepričan da se s časom tudi adaptira na vsakega uporabnika - drugače ne bi bil Google. Rezultati z njim niso slabi, se pa zaradi zgornjih treh razlogov seveda ne morejo primerjati z Nuance Dragon Medical. Sicer pa to tudi ni njegov namen.

Delovanje Google Speech API razpoznavalnika za slovenščino lahko online stestiraš na tem demotu (rabiš sicer Chrome):
https://www.google.com/intl/en/chrome/d...

Uporablja pa ga tudi tale online voice notepad (spet rabiš Chrome):
https://dictation.io/speech

Po nekaterih informacijah, so Google Speech API nekaj časa uporabljali tudi za razpoznavanje govora pri Telekomovem Neotu, ali je še tako, pa ne vem.

Se pa zadnje leto po vzoru tujine na tem področju raziskovalno/razvojno dogaja tudi v Sloveniji. Teče namreč projekt Razvoj slovenščine v digitalnem okolju, kjer je cilj zagotoviti prosto dostopne rešitve za govorne tehnologije v slovenščini, med njimi tudi razpoznavalnik govora. Več info je tukaj:
https://www.cjvt.si/rsdo/

andmer99 :: 9. dec 2020, 23:54

nergac je 9. dec 2020 ob 22:11 izjavil:

Super.

I am from Slovenia.
I am from Slovakia.
I am from Slavonia.

Prej bom dočakal človeka na marsu ... V kriogenem stanju.

Zdaj pa ne vem, če bo to Živadinov ali bom kar sam.

Ta Slovakia/Slovenia/Slavonia primer je za razpoznavalnik govora kar zloben. Še posebej, če govorčev materin jezik ni angleščina.

Sem pa sedaj prvič probal ta primer z dictation.io (Google speech API US English), pa mi začuda vse razpozna 100%! Pa je moja angleščina kar lepo "slovanska". Razpoznavanje govora je v zadnjih 10 letih naredilo velik korak naprej na račun nevronskih mrež in pa big data pristopa, tako da se to pozna tudi pri takšnih zagonetnih primerih.

Torej te je Google v kriogenem stanju poslal na Mars - prijetno potovanje ;-)

PS: Ali pa Google speech API najprej detektira slovansko angleščino, potem pa vklopi specialni dodatni modul za razpoznavanja stavkov "I am from [some Slavic shithole]"....

PPS: upam, da sem prinesel par novih informacij v to staro temo.

nergac :: 10. dec 2020, 08:42

Najlepša hvala za osvežitev teme z novimi oziroma starimi informacijami.

Laki_ laik :: 10. dec 2020, 21:15

andmer99 hvala za tako lepo napisan in razložen prispevek.Malo je takih.

Vredno ogleda ...

	Tema	Sporočila	Ogledi	Zadnje sporočilo
	Tema	Sporočila	Ogledi	Zadnje sporočilo
»	Glasovno upravljanje telefona v slovenščini - android urb9 Oddelek: Mobilne tehnologije	19	7542 (1156)	dunda 10. avg 2025 10:55:57
»	Program za pretvorbo govora v tekst Laki_lai k Oddelek: Loža	13	5820 (754)	dunda 28. jul 2025 08:45:43
»	Slovenski sintetizator govora eBralec dunda Oddelek: Programska oprema	38	8768 (4956)	Irbis 28. okt 2021 18:40:35
»	Prepoznavanje govora Enterprise Oddelek: Programska oprema	35	9347 (6972)	Blop 12. feb 2017 20:40:00
»	Prepoznavanje zvoka in predvajanje MP3 v C++ ali Delphiju divac Oddelek: Programiranje	28	3381 (3093)	Thomas 4. apr 2001 23:18:10

Več podobnih tem

Forum » Programska oprema » Pretvorba govora v tekst

Pretvorba govora v tekst