» »

Slovenski sintetizator govora eBralec

Slovenski sintetizator govora eBralec

dunda ::

Razvoj jezikovnih tehnologij v zadnjem času neverjetno napreduje. Sedaj je na voljo eBralec, sintetizator slovenskega govora, ki odlično govori slovensko. Vanj smo vgradili tehnologijo, ki smo jo Alpineon, Amebis in Institut Jožef Stefan razvijali v zadnjih desetletjih.
Avtomatsko generiran govor je zelo naraven in uporaben v najrazličnejših rešitvah, poleg moškega pa vsebuje tudi ženski glas.

Poslušajte, kako govori novi eBralec:
Rdeča kapica - odlomek iz pravljice

Sinteza govora je nepogrešljiva povsod tam, kjer je predrago ali pa ni mogoče dovolj hitro posneti (spreminjajočih) besedil s pomočjo živega govorca. Zvočni zapis besedila omogoča takojšnje poslušanje ali pa shranjevanje v zvočno datoteko za kasnejše predvajanje.

V praksi eBralec omogoča:
- ozvočenje spletnih strani in posledično tudi večjo družbeno odgovornost do tistih, ki težko berejo ali ne morejo brati;
- ozvočenje (mobilnih) aplikacij in s tem izboljšanje komunikacije z uporabniki;
- ozvočenje naprav, ki jih je bilo prej treba držati v roki in dvigniti učinkovitost in povečati varnost (recimo v skladiščih);
- poslušanje knjig, člankov, e-pošte ali drugih besedil (npr. med vožnjo);
- znižanje visokih stroškov vnaprejšnjega snemanja besedil …

Nekateri eBralca že uporabljajo - recimo slepi in slabovidni, pa tudi podjetja. Recimo DARS v svoji mobilni aplikaciji DarsPromet+, ki voznika sproti obvešča o dogajanju na poti, ne da bi ta moral brati obvestila med vožnjo. Podatke iz prometne podatkovne baze posebna funkcija v realnem času spreminja v besedilo, ki ga eBralec sproti pretvarja v zvočno sporočilo. Tako vsak uporabnik glede na lokacijo in smer potovanja dobiva aktualna prometna obvestila, ki so namenjena samo njemu.
Podobne rešitve so zdaj na voljo vsem. Kanček domišljije in prilagoditev pa lahko odpre še nove uporabe slovenske sinteze govora.
Več informacij: eBralec
https://www.kacnje.eu

GupeM ::

Zakaj pa ni možen brezplačen preizkus na spletu? Omejiš na nekaj 100 znakov, če te že skrbi, da ga bojo preveč uporabljali.

dunda ::

Saj je - omejena na 250 znakov. Zgoraj v meniju "Branje".

Druga možnost je s pomočjo desetdnevne preizkusne licence (meni "Naroči"). Nameščeni program nima omejitev dolžine.
https://www.kacnje.eu

Irbis ::

GupeM je izjavil:

Zakaj pa ni možen brezplačen preizkus na spletu? Omejiš na nekaj 100 znakov, če te že skrbi, da ga bojo preveč uporabljali.

Saj je možen:
http://ebralec.si/branje/

jernejp ::

Odlično

sandmat ::

glede na milijone, ki smo jih zmetali v inkarnacije tega projekta, bi lahko bil izdelek prostodostopen.

Invictus ::

sandmat je izjavil:

glede na milijone, ki smo jih zmetali v inkarnacije tega projekta, bi lahko bil izdelek prostodostopen.

Točno to...

Uzurpiran softver iz IJS...
"Life is hard; it's even harder when you're stupid."

http://goo.gl/2YuS2x

dunda ::

Zgoraj omenjena podjetja so od tistih milijonov videla silno majhne, prav mikroskopske koščke. Verjemi. Lahko, da so jih potegnili tisti, ki so kaj raziskovali in filozofirali. Ne vem.
Tisti, ki so to naredili, so precej let vlagali svoj denar v tole, sofinanciran je bil le en košček. In zaradi tega sofinanciranja imajo tole sintezo brezplačno slepi, slabovidni, dislektiki in javna uprava (šole ...). Podjetja in posamezniki pač ne. To je razumljivo.
https://www.kacnje.eu

sandmat ::

Ne, ni razumljivo, še celo nezakonito je.

Projekt je bil neštetokrat v pretežni meri sofinanciran iz EU sredstev. Mora biti prostodostopen posamezniku. Zadnje financiranje je bilo na ESMA projektih, kjer je bilo kodo po navodilih razpisa dat na prosto uporabo. Še vedno nisem videl github linka do projekta.

noraguta ::

Ni glih wavenet
Pust' ot pobyedy k pobyedye vyedyot!

Invictus ::

@dunda

Saj ni treba delati reklame za Amebis...
"Life is hard; it's even harder when you're stupid."

http://goo.gl/2YuS2x

mlamat ::

Zelo zanimivo je brati strokovni članek o delu ki so ga opravili.

noraguta ::

Ke paj gams zdej. Holozan pa Rozman sta pa itak klasika.
Pust' ot pobyedy k pobyedye vyedyot!

dunda ::

Invictus je izjavil:

@dunda

Saj ni treba delati reklame za Amebis...


Zakaj ne?
Edini razlog je kršenje 17. člena pravil, ampak so mi tako svetovali med debato o tem, da ta novica ni zanimiva.
https://www.kacnje.eu

dunda ::

sandmat je izjavil:

Ne, ni razumljivo, še celo nezakonito je.

Projekt je bil neštetokrat v pretežni meri sofinanciran iz EU sredstev. Mora biti prostodostopen posamezniku. Zadnje financiranje je bilo na ESMA projektih, kjer je bilo kodo po navodilih razpisa dat na prosto uporabo. Še vedno nisem videl github linka do projekta.


Po informacijah, ki jih imam, je kodo, ki je bila sofinancirana in izdelana v okviru projekta eBralec, mogoče dobiti in uporabiti. Tega je tudi relativno malo. Sicer je VEČINA kode, predvsem pa VSI JEZIKOVNI VIRI, ki jih eBralec vsebuje, v lasti obeh podjetij (že desetletje pred projektom razviti in financirani iz lastnih sredstev). Zato sofinancirani del kode sam po sebi nikomur ne koristi prav dosti. Vrednost jezikovnih orodij (tudi sintetizatorjev) je namreč v kvalitetnih vhodnih virih, koda, s pomočjo katere iz pravega vhodnega vira narediš sintetizator, pa je že dolga leta na voljo kot open source s strani več (tujih) ponudnikov. Je pa velika razlika med "razvitim" (običajno v praksi neuporabnim) sintetizatorjem (npr. mnogi projekti na inštitutih ali fakultetah), in res uporabnim končnim izdelkom, ki mora imeti še cel kup stvari zraven, da ga ljudje res lahko uporabljajo.
https://www.kacnje.eu

aerie ::

Tole deluje odlično. Kako pa zadeve stojijo v obratni smeri, torej slovenski govor v tekst?

dunda ::

Hvala. Ravno prejle so mi eBralca pohvalili tudi na občini, kjer ga bodo verjetno implementirali (javna uprava -> brezplačna raba, da ne bo kdo spet skočil v zrak).
Razpoznava govora načeloma precej dobro deluje pri Googlu. Sploh na Androidih se kar uporablja.
https://www.kacnje.eu

Zgodovina sprememb…

  • spremenil: dunda ()

noraguta ::

Svari so zadnje tri leta se mi zdi naredile gromozanski preskok.

Dunda dobr delate.
Pust' ot pobyedy k pobyedye vyedyot!

Zgodovina sprememb…

  • spremenilo: noraguta ()

PaX_MaN ::

sandmat je izjavil:

Mora biti prostodostopen posamezniku. Zadnje financiranje je bilo na ESMA projektih, kjer je bilo kodo po navodilih razpisa dat na prosto uporabo.

Motite se.
Avtorske pravice so na naročnika prenešene zgolj na delu kode, javna objava je pridržana ZDSSS, ta pa ni zavezanec po ZDIJZ.
Lahko pa seveda podate kakšno (evropsko) zakonodajo ki pravi drugače ("navodila razpisa" da so merodajna? roflol).

dunda ::

noraguta je izjavil:

Svari so zadnje tri leta se mi zdi naredile gromozanski preskok.

Dunda dobr delate.


Hvala. Če bo kdo potreboval kakšen malo daljši preizkus, naj se kar oglasi. Če je deset dni premalo.

PaX_MaN je izjavil:

sandmat je izjavil:

Mora biti prostodostopen posamezniku. Zadnje financiranje je bilo na ESMA projektih, kjer je bilo kodo po navodilih razpisa dat na prosto uporabo.

Motite se.
Avtorske pravice so na naročnika prenešene zgolj na delu kode, javna objava je pridržana ZDSSS, ta pa ni zavezanec po ZDIJZ.
Lahko pa seveda podate kakšno (evropsko) zakonodajo ki pravi drugače ("navodila razpisa" da so merodajna? roflol).


Tako je. Koda, ki jo podjetji razvijata leta, je pač njuna. Projektni del pa je le košček.
https://www.kacnje.eu

Zgodovina sprememb…

  • spremenil: dunda ()

NikolormousB ::

Zgleda zanimivo. Se da dobiti online verzijo za tiste, ki nismo na mikrosoftu ali je na voljo samo windows app?

dunda ::

Obstaja strežniška verzija (sicer spet Windows), potem pa lahko uporabljaš iz različnih koncev. Načeloma se lahko namesti pri vas ali pa mi ponudimo strežnik ali ga postavimo. Stvar dogovora.
Recimo za splet je sedaj največ interesa. Pa neka aplikacija za Android se mi zdi, da se pripravlja, ki bo pač klicala servis na strežniku - za stvari, ki se sproti spreminjajo. Saj tukaj je bolj stvar domišljije, da človek najde, kje mu to lahko koristi. Za kakšne servise, ki lahko delujejo 24/7 čisto samodejno za uporabnike.
https://www.kacnje.eu

Invictus ::

sandmat je izjavil:

Ne, ni razumljivo, še celo nezakonito je.

Projekt je bil neštetokrat v pretežni meri sofinanciran iz EU sredstev. Mora biti prostodostopen posamezniku. Zadnje financiranje je bilo na ESMA projektih, kjer je bilo kodo po navodilih razpisa dat na prosto uporabo. Še vedno nisem videl github linka do projekta.

A lahko tole kaj dokažemo?

Pa prijavimo Amebis evropski komisiji.

Imaš kake papirje, linke?
"Life is hard; it's even harder when you're stupid."

http://goo.gl/2YuS2x

Zgodovina sprememb…

  • spremenil: Invictus ()

M.B. ::

Govor je boljši kot prej, ampak pričakoval bi kaj boljšega iskreno povedano. Mogoče sem razvajen od crystal clear angleških glasov. Primeri: Espeak slovenski. Espeak hrvaški. Glede na to da je to delo prostovoljcev in da je slovenski glas še v malo prejšnjih verzijah bil testni bi pričakoval malo boljše. Res je da je Bralec bolj živ in ima več intonacije, ampak se mi zdi da ima več robotskega dela kot pa hrvat ki bere slovenščino. Še primer, kaj se zastonj dobi za angleščino Festival. Verjamem, da je bilo vloženo ogromno dela, že samo snemanje posnetkov pobere ogromno časa in denarja, ampak nevem no, od plačljive storitve bi pričakoval več kot od zastonjske, zato tudi pri Windowsih ne toleriram marsičesa, kar pri Linuxu.

Letos je bilo zelo uspešno leto za TTS in STT. Najprej googlov Wavenet, koda je na Githubu (Ne originalna ampak reimplementacije po članku), potem Googlov Tacotron, audio samples, ki se baje nauči še hitreje kot wavenet. 23 ur besedila npr. Ena od Implementacij na GitHubu. Za angleščino se ni problem igrat, ker se da dobit kar dosti besedil in teksta že označenega, ampak pričakoval bi, da bi podjetja, ki pri nas že imajo označena besedila to uporabila za izdelavo najboljšega kar se da. Sam bom poskusil pognat kako tacotron na slovenskem tekstu, mogoče rata.

Pri tem pa seveda ne smemo pozabiti na Baidu Deep speech 1,2 in 3 in pa Mozilino implementacijo le tega.
Everyone started out as a newbie.
Sadly only a handful ever progress past that point.

dunda ::

M.B. - vidim, da dobro poznaš področje sintetizatorjev. Sam sicer nisem iz tega področja, vem sicer, da imajo slepi in slabovidni celo nekoliko specifične zahteve. Tako na primer je njihova privzeta hitrost precej večja, kot naša. Ko poslušam z njihovimi nastavitvami, ne razumem skoraj ničesar.
Ampak tisti Espeak slovenski, ki si ga dal - to je pa precej slabše od eBralca. Tudi slabše od prejšnjih verzij Govorca. Vsaj zame ni primerjave, pa poslušam čisto tako neobremenjeno.

Ideje in znanje za izboljšave so, prav tako pa smo odprti za morebitna sodelovanja.
https://www.kacnje.eu

sandmat ::

Invictus je izjavil:


Imaš kake papirje, linke?


https://www.uradni-list.si/glasilo-urad...

išči "javno dostopne". Pred letom je bila obširnejša novica celo na s-t o celotnem znesku financiranja (nekaj čez 2 milio v 10 letih).

dunda ::

Samo od tistega zneska je bilo za samo sintezo le košček, košček ... se lahko preveri, če imaš višek časa.
https://www.kacnje.eu

sandmat ::

sem preveril, skupaj nekaj čez 2 milijona. Rad bi videl, da je javno financiran software javen in ni to obvod kako financirat zasebne firme.

dunda ::

O teh napihnjenih zneskih je bilo že pred časom nekaj govora. Porinjeno s strani tistih, ki so želeli poriniti tuje rešitve in potegniti smetano brez dela. In tako gre spet naprej.
odgovor na podobno kritiko.

Programska oprema, ki je nastala prej, seveda ni javno dostopna. Zaradi sofinanciranja pa je brezplačno za slepe, slabovidne, dislektike in celotno javno upravo (šoli, vrtci, občine, ministrstva, RTV Slovenija ...). To sofinanciranje je le košček stroškov razvoja. Ne misliti, da razvoj sinteze stane tako malo, kot smo dobili. Tiste milijone pa lahko mirno pozabiš. Jih nisem nikjer videl. Nam res težko očitaš kakšne obvode in pritlehna financiranja.
Če sofinanciranja ne bi bilo, prej našteti ne bi imeli sinteze oziroma bi jo kupovali.
https://www.kacnje.eu

Invictus ::

@dunda

Kje pa misliš, da je nastal prvi govorec? Na IJS... Torej na javnem inštitutu. Torej bi moral biti na voljo zastonj...

Ne glede na to, da je po nekem čudnem scenariju Amebis dobil avtorske pravice. Kar predvidevam glede na plačljiv software.

V Sloveniji, da se javna sredstva transparentno porabijo? Kaj tebi ni jasno?
"Life is hard; it's even harder when you're stupid."

http://goo.gl/2YuS2x

misek ::

sandmat je izjavil:

Rad bi videl, da je javno financiran software javen in ni to obvod kako financirat zasebne firme.
Sva se včeraj s sodelavcem pogovarjala o tej problematiki. In povedal mi je en primer javnega razpisa, kjer je bil namen izdelava programske opreme, ki se nato prodaja (menda je šlo za neka učna gradiva). In v razpisu je to bilo izrecno zapisano. Torej je z javnim denarjem nekdo nekaj naredil in nato služil s prodajo. Podrobnosti pa se ne spomni več. Verjetno vse ni bilo 100% javno financirano.

dunda ::

Invictus je izjavil:

@dunda
Kje pa misliš, da je nastal prvi govorec? Na IJS... Torej na javnem inštitutu. Torej bi moral biti na voljo zastonj...
Ne glede na to, da je po nekem čudnem scenariju Amebis dobil avtorske pravice. Kar predvidevam glede na plačljiv software.

Ja, prvi Govorec 1.0 je res nastal na IJS. Za slepe in slabovidne je bil zastonj, za ostale (tako ali tako neuporaben) pa ne vem, ampak s tem Amebis itak ni imel nič. Ker je bil IJS Govorec v novih verzijah Windowsov neuporaben (ni deloval), je Govorca 2.0 potem Amebis v sodelovanju z IJS naredil povsem na novo. Z Govorcem 1.0 je imel skupno le ime in delček njihove stare kode. Razvoj ni bil sofinanciran iz javnih sredstev, zato je bil Govorec 2.0 plačljiv. Nekaj denarja je potem država sicer vlagala v raziskave sinteze govora, ampak treba je ločiti med raziskavami in razvojem izdelkov (pri nekaterih razpisih je država celo postavila pogoj, da rezultat ne sme biti niti prototip, kaj šele izdelek!). Prvi razpis, ki je dejansko sofinanciral izdelavo sintetizatorja govora kot uporabnega izdelka, je bil leta 2015, in takrat je bil razvit eBralec. Problem je torej v državi oz. njenih razpisih. Mi smo vedno izpolnili vse njihove pogoje, kakršni so pač bili.
https://www.kacnje.eu

Uporabnix ::

Tale egovorec me pa na tole spomne:


Morda če dam študij na pavzo za ene par let, da vi še malo izpilite govorca in da tlele eni iztožijo javnost programa, sem bom mogoče lahko učil z zaprtimi učmi? Knjigo poskeniraš, program jo pretvori v pdf tekst, tekst prilepiš v egovorca in smo zmagali. 8-)

dunda ::

Saj nekateri tako poslušajo knjige (ne samo slepi). Načeloma je ideja zanimiva. Pa otrokom pravljice spustiš :-)
https://www.kacnje.eu

Uporabnix ::

Obstaja ja, a so trenutno knjige le v angleškem, švedskem, španskem, danskem in ruskem jeziku (Audible storitev). Torej mora biti knjiga že posneta. Da bi kar neko random slo knjigo poslušal, bi bilo pa tako kot sem napisal verjetno najceneje.

Irbis ::

misek je izjavil:

sandmat je izjavil:

Rad bi videl, da je javno financiran software javen in ni to obvod kako financirat zasebne firme.
Sva se včeraj s sodelavcem pogovarjala o tej problematiki. In povedal mi je en primer javnega razpisa, kjer je bil namen izdelava programske opreme, ki se nato prodaja (menda je šlo za neka učna gradiva). In v razpisu je to bilo izrecno zapisano. Torej je z javnim denarjem nekdo nekaj naredil in nato služil s prodajo. Podrobnosti pa se ne spomni več. Verjetno vse ni bilo 100% javno financirano.


Saj podobno je tudi pri knjigah, ki jih sofinancira Javna agencija za knjigo.
Ampak če greš npr. pogledat v njihov zadnji razpis za sofinanciranje elektronskih izdaj knjig, vidiš, da je znesek sofinanciranja za pripravo elektronske izdaje 50 evrov (če ni kakšna grafično posebno zahtevna knjiga, kjer gre do 150 evrov).

dunda ::

Uporabnix je izjavil:

Obstaja ja, a so trenutno knjige le v angleškem, švedskem, španskem, danskem in ruskem jeziku (Audible storitev). Torej mora biti knjiga že posneta. Da bi kar neko random slo knjigo poslušal, bi bilo pa tako kot sem napisal verjetno najceneje.


Ja, prav veliko slovenskih knjig res ne najdeš v tekst obliki. Lažje je pri časopisih in revijah, pa kakšni članki ... tako uporabljajo. Sicer pa še skeniranje :-)
https://www.kacnje.eu

al-ko ::

Sem slaboviden in uporabljam TTS eBralec, njihove glasove pa bi lahko uporabljal v TTS Pripovedovalec (Windows Narrator)in NVDA. Težava je v standardu glasov, eBralec zahteva »Windows SAPI5«, druga dva navedena pa »Windows One Core«. Čeprav se v naboru glasov nahajajo vsi glasovi eBralca in jih lahko izberemo, ob uporabi Pripovedovalca ali NVDA ostajajo nemi. V obeh aplikacijah pa deluje microsoftov Lado. Ebralec ima tudi TTS aplikacijo eBralec Mini, ki deluje samostojno, vendar le za krajše tekste, ki jih lahko kopiramo v odložišče.
Primerjava glasov eBralca in Microsoft Lada daje prednost glasovom eBralca, intonacija besed je pravilnejša.
Ima kdo idejo, kako aktivirati glasove eBralca (SAPI5) v aktualni sintezi OneCore.

Irbis ::

Morda bi pomagal program Balabolka, ta podpira SAPI5.


Vredno ogleda ...

TemaSporočilaOglediZadnje sporočilo
TemaSporočilaOglediZadnje sporočilo
»

Pretvorba besedila v govor (za slovenski jezik)

Oddelek: Loža
376756 (3236) tiltech
»

Pretvorba govora v tekst

Oddelek: Programska oprema
388489 (3369) Laki_ laik
»

Program za pretvorbo govora v tekst

Oddelek: Loža
84432 (4000) ToniT
»

Glasovno upravljanje telefona v slovenščini - android

Oddelek: Mobilne tehnologije
175436 (4843) dunda
»

Prepoznavanje govora

Oddelek: Programska oprema
357042 (4667) Blop

Več podobnih tem