» »

Računalnik-prevajalec

Računalnik-prevajalec

1
2
»

Thomas ::

Kako bi se jest lotil SLO-ANG (in ANG-SLO) prevajalnika?

Recimo, da bi neka pravila prevajanja že imel.

Pa nekaj obveznih prevodov tudi.

Pravila bi v evolucijski zanki mutiral toliko časa, da bi bili izpolnjeni vsi obvezni prevodi, v obe smeri.

Program bi se testiral sam. Obsežen ANG text bi prevedel v SLO (obratno) in nazaj. Povsod, kjer ne bi bilo z originalom identičnega prevoda nazaj, je potencialen problem. Kjer pa so razlike največje, pa zagotovo je.

Spet v zanki mutiramo pravila toliko časa, da zadosti tudi temu.

IMHO, se človek na en podoben način uči tujega jezika. Potem, ko proizvede dovolj dober translacijski pravilnik, se mu pa zdi, da "razume".

Tako bi se program (recursive self improver) lahko naučil vseh jezikov tega sveta, ki se jih da slišati ali brati.

"Razumel" bi jih.

Very zen, isn't it?
Man muss immer generalisieren - Carl Jacobi

gzibret ::

> Very zen, isn't it?

Najbolje je posnemati naravo.
Vse je za neki dobr!

BluPhenix ::

Ja sej problem bi že našel, težje je najti pravo rešitev na problem ki ga vidi, če dela stvari tako "malo na random".

Problem je tudi to, ker bi moral imeti vsa slovnična pravila enega in drugega jezika in ogromno prevodov istega avtorja, s katerimi bi lahko potem tako evolviral. Zakaj istega avtorja? dva avtorja lahko enako besedno zvezo prevedeta na precej drugačen način, računalnik bi to opazil in bi se moral odločiti za enega. Naključno. Seveda je lagko tako narejen, da se ob vsakem takem problemu odliči za istega avtorja, vendar potem drugi nekako odpade.

Kar pa smo vse že napisali.

EDIT: ne vem če se tako človek nauči drugega jezika. Saj pravil ne sklepa iz tekstov ampak se navadno pravila jezika nauči posebej. In jih potem uporablja v tekstih.
Podpisa ni več, ker so me poskušali asimilirati.

Zgodovina sprememb…

Thomas ::

> Problem je tudi to, ker bi moral imeti vsa slovnična pravila enega in drugega jezika in ogromno prevodov istega avtorja, s katerimi bi lahko potem tako evolviral.

Zakaj? Pač vpraša, kar ne ve. Tako kot vsak hud prevajalec. Magari pošlje post na par forumov.
Man muss immer generalisieren - Carl Jacobi

snow ::

BluPhenix
> Saj pravil ne sklepa iz tekstov ampak se navadno pravila jezika nauči posebej. In jih potem uporablja v tekstih.

Aha. Tebe so prvo naučili vsa pravila, ko si se učil materinega jezika. Ko si bil star leto in pol so ti rekli "če je samostalnik moškega spola in ga uporabljaš v ..."? Ali so ti pravili "narobe, to se pa reče tak pa tak".
Isto se preko teksta otroci učijo večih jezikov.

Pa evolucija ni glih "malo na random".

Thomas
se popolnoma strinjam s tem. Evolucija translatorja.

Mogoče nebi blo slabo vzet en jezik (alpa ga izumit) za osnovo, pa vse preko tega prevajat... tako da se naredi zgolj 2N translatorjev namesto N2. Treba edino pazit da se noben pomen/podrobnost pri tem procesu ne izgubi.
Random mutation plus nonrandom cumulative natural selection - Richard Dawkins

Zgodovina sprememb…

  • spremenilo: snow ()

Thomas ::

Ja, to je pomembno, da je pravil čimmanj.

Enostavnost v smislu Kolmogorova MORA bit spoštovana!

> Tebe so prvo naučili vsa pravila, ko si se učil materinega jezika.

Ja, tkole visoko mnenje imajo o sebi ljudje. Prevajalcem nevidna roka zastre oči nad napakami iz svoje prevajalske preteklosti. Vsaj, ko se naslajajo nad "glupostjo mašine".

Podobno uni šoferji, v sosednji temi.
Man muss immer generalisieren - Carl Jacobi

gzibret ::

> Tebe so prvo naučili vsa pravila, ko si se učil materinega jezika.

He he he.

Dojenček govori (ponavlja): jaz, ti, on, midva, vidva, onadva..... sem, si, je, sva, sta, sta, smo, so, so.....

V resnici je malo drugače: ata, mama, papu.
Vse je za neki dobr!

BluPhenix ::

snow, ti se res naučiš osnovna pravila skozi poslušanje jezika. Če jih tvoj učitelj ne pozna dobro, boš tudi ti povzel pravila po njem. PA čeprav bodo narobe, kar je velikokrat v pogovornem jeziku. Tistih "pravih" pravil jezika se pa naučiš v šoli.

EDIT:
Čeprav tudi ko si otrok in neko stvar "prvič uporabiš": jaz kaka, te starši ponavadi popravijo: jaz kakam, torej ti nek zunanji source pove da si naredil napako in ti popravi skladno s pravilom, ki ga pozna. In to se dogaja večinoma nekako do šole, ko te naučijo, kako te stvari popraviš sam. To bi bilo potrebno tudi pri računalnikih, samo da bi si tudi oni morali nekako predstavljati kaj stvar pomeni, posebno za zahtevnejše prevode. Jaz kaka bi pa moral tudi računalnik popravit, čeprav lahko "pomisli" da je Jaz ime nekoga ki kaka in je torej Jaz kaka pravilno. Če je pravilno pa vidiš iz konteksta.

Tu se tudi vidi rezlika med nekom, ki se je jezika naučil čez pogovor in nekoga drugega, ki se ga je učil veliko po pravilih. Tisti, ki se ga je naučil skozi pogovor navadno pravila ne dosti zanimajo, nekaj reče in je običajno prav. Ni pa nujno, tudi ne ve zakaj je prav. Če se pojavi stvar, ki je še ni slišal ni nujno, da jo bo pravilno uproabil. Nekdo ki se je pa jezika učil tudi preko pravil pa bo deloval čisto drugače. Med normalnim pogovorom bo navadno vse pravilno povedal, tudi vse ti bo vedel povedati zakaj je tako povedal. Bistvena razlika se pa pokaže ko mora interpretirati neko "novo stvar". Recimo prevajalec bo stavek analiziral in bo točno vedel čas/osebo in vse ostalo, torej bo prevod spisal po pravilih. Med tem ko bo 1 samo ugibal.

Sej pravilno razmišljate vendar je do implementacije tega še dolga pot. Thomas ja pravil mora biti čim manj in morajo biti čim enostavnejša, na žalost pa pri jezikih niso.
Podpisa ni več, ker so me poskušali asimilirati.

Zgodovina sprememb…

Thomas ::

> na žalost pa pri jezikih niso.

Kolikor enostavna se da. 10 Mega pravil, 10 Mega pravil, če je to minimum.
Man muss immer generalisieren - Carl Jacobi

BluPhenix ::

no :D

Skratka, da ne toliko pisarimo in se vrtimo okrog istih stvari:

Carnivore: pejdi študirati tusto kar ti je všeč in kjer si pripravljen vložiti nekaj truda. V kolikor boš svoj poklic obvladal se ti ni treba bati za delo ne v enem ne v drugem. Računalničarje se vedno rabi in vedno več po zadnjih ocenah, prevajalcev pa tudi, saj ima slovenija 500 prevajalcev premalo ali koliko že (ampak moraš biti pripravljen it v bruselj). Če te pri prevajalstvu zanima tisti, najvišji honorar pa, v koliko si tip, poprimi za simultano prevajanje. Veliko denarja, ampak tudi stresa, večinoma ljudje v tem ne zdržijo daljših obdobij (vsaj brez dolgih pavz)

Glede računalniških predvodov pa se stvari premikajo, ne zvelikimi koraki ampak se. Osebno vidim tak softver bolj v pomoč prevajalcu, kot pa orodje nekoga ki o jeziku nima pojma in rabi za prevajanje spisov v drugi jezik. Ampak no, bomo vidli kako se bo obrnilo.
Podpisa ni več, ker so me poskušali asimilirati.

leinad ::

Vem, da je simultano prevajanje zlata jama. Ampak dvomim, da si lahko simultan prevajalec dokler ne živiš en čas v državi, kjer govorijo jezik v katerega si se naučil prevajati. To je res huda stvar in zahteva brezhibno obvladanje jezika, nimaš se časa spominjat te pa one besede.

Nekako imam v mislih prevajanje slovenščina-kitajščina-angleščina in vice-verso.

Zgodovina sprememb…

  • spremenil: leinad ()

BluPhenix ::

Torej misliš študirati Cinologijo In Germanistiko vzporedno. Po stvareh ki sem jih slišal (in videl pri punci, sicer je bila enopredmetno ang.) je to zelo zelo zahtevno. Sicer palahko še njo vprašam bolj točno, saj je imela nekaj sošolk, ki so tako študirale, so se pa potem vse odločile ali za en ali drugi jezik, torej so vzporedni študij opustile.
Podpisa ni več, ker so me poskušali asimilirati.

Irbis ::

@BluPhenix
Mislim, da isti avtor ni potreben - če je isto stvar možno prevajati na več načinov, bo program pač izbral tisto, ki se bo najpogosteje pojavila in tako ustvaril svoj lastni slog prevajanja, podobno kot ga ima vsak živ prevajalec.

@Thomas
Pravzaprav tako poteka tudi ročni razvoj prevajalnika: dopišejo se nova pravila, potem se pa preizkusi, kako deluje na primerih. Kjer se stvar spremeni se pogleda, če je sprememba na boljše ali na slabše in ustrezno popravi.
Težava pri avtomatskem učenju je, da potrebuješ res ogromen vzorec, da zajameš jezik. Ne moreš se učiti le iz nekaj primerov pojavitve, da uporabo besede res spoznaš (in se lahko greš neka sklepanja), bi recimo moral imeti v korpusu vsaj kakšnih 1000 pojavitev zanjo; še pri 100 milijonskem korpusu imaš le približno 10000 takih besed.
Človek na podlagi svojega znanja jezika veliko laže posplošuje pravila. Je pa s tem res veliko dela, enostavneje je napisati evolucijski program in ga pustiti teči nekaj tisoč let :)

Primer statističnega (strojno naučenega) prevajalnika za slovenščino je Menola.

@BluPhenix
Tisti, ki o jeziku nimajo pojma, si s strojnimi prevajalniki lahko pomagajo toliko, da približno uganejo, o čem besedilo govori. Nekoč sem dobil povezavo na eno stran v japonščini, strojni prevajalnik je naredil bolj ali manj zmedo, ampak s kar nekaj ugibanja in pregledovanja variant sem uspel ugotoviti, za kaj je šlo. Seveda je pa v tako branje treba vložiti veliko več truda kot v branje pravega prevoda. Ampak tudi živi prevajalci te kdaj tako presenetijo, sem že prebral v knjigi, da so uporabili "bencinski spektrograf" 8-O

leinad ::

Bi ti bil zelo hvaležen, če bi mi preko ZS posredoval kakšne info o tem, če tvoja punca študira te smeri. Če gre, lahko tudi kakšen direkt kontakt, da njo vprašam konkretno kar me zanima.
Ker o zahtevnosti tega nimam pojma, res ne. Rad pa bi nekako vključil sinologijo, ker je zelo perspektivna ob naraščajoči moči Kitajske.

BluPhenix ::

Ja ok to uporabnost sem pozabil semi mislil bolj za profi prevode. Recimo knjig, pravil, zakonov,... ne take "uporabniške" :D Ja take pravajalske cvetke so pa velikokrat stalnica, pač ko vsak misli, da lahko prevaja vse. Zato pa so navadno specializirani prevajalci:D

Ja samo če je več prevajalcev lahko od vsakega pobere nekaj in bo potem opazno menjavanje sloga v besedilu.
Podpisa ni več, ker so me poskušali asimilirati.

Irbis ::

Taki "uporabniški" prevodi bodo glavna uporaba strojnega prevajanja še dolgo časa - forumov in spletnikov tudi nikoli ne bodo prevajali živi prevajalci. Pa kakšna dopisovanja starejših ljudi z daljnimi sorodniki iz Amerike, vnuki niso vedno pri roki za prevajanje.

Težava pri tem spektrografu je bila, da je šlo za leposlovje - kjer pa je bil mimogrede omenjen tehnični termin. Tu je pa druga možnost uporabe strojnega prevajanja, ki lahko služi prevajalcu kot avtomatiziran slovar. Prevajalec pač ne gre vsake besede iskat po slovarjih in preverjat, če ima morda še kakšen drug pomen, razen če se mu res ne zazdi preveč čudno vse skupaj. Tako pa lahko prebližno prevede in vidi, če je računalnik predlagal kakšno zanimivo alternativo, če ima seveda strojni prevajalnik vgrajen dovolj popoln slovar.

Zgodovina sprememb…

  • spremenil: Irbis ()

Tear_DR0P ::

problem prevajalcev ni v tem, da ne znajo prevajat iz določenega področja. bolj je problem, da ne razumejo jezika, v katerge prevajajo
seveda ima področje vpliv, ampak če ti znaš slovensko, boš mel dost manj težav s prevajanjem iz nepoznanega pdročja, kot pa če ti je slovenščina tuja
sam sem dost prevajal in sem videl kako mi slovenščina dela blazne težave
"Figures don't lie, but liars figure."
Samuel Clemens aka Mark Twain

BluPhenix ::

Ja zato pa prevajalci morajo znati oba jezika, med katerima prevajajo. Na študiju prevajalstva imaš tudi slovensko slovnico in podobno. Na diplomskem izpitu moraš vedno prevesti iz tujega jezika v slovenščino in iz slovenščine v tuj jezik.
Podpisa ni več, ker so me poskušali asimilirati.

OwcA ::

Načeloma bi se naj prevajalo samo iz tujega jezika v materinščino.
Otroška radovednost - gonilo napredka.

BluPhenix ::

No to pa ne vem (oz prvič slišim). Vem, da moja punca prevaja večinoma obratno iz slo v ang, saj je po temu veliko povpraševanja, še posebno zaradi internet strani, katalogov za na sejme in podobno.

Mogoče da je tako kot si napisal v kakšnem pravilniku, ampak se mi zdi da to velja bolj za "ta velike" jezike. Saj dvomim, da se veliko "native" angleško govorečih ljudi odloča za študij prevajalstva slovenščine :D tako da pri nas furajo oboje. Pač še vedno imamo nekako specializirane prevajalce, spet pa ne tako ozko.
Podpisa ni več, ker so me poskušali asimilirati.

Gundolf ::

Načeloma bi se naj prevajalo samo iz tujega jezika v materinščino.

No potem pa z računalniki kot prevajalci med človeškimi jeziki nimamo kaj za delat ;)

Tear_DR0P ::

owca ma tule prav - če že želiš prevajat iz slovenščine v tuj jezik, je fino da v tujem jeziku par let aktivno govoriš in pišeš, ter seveda bereš in poslušaš - drugače se ti dogaja da ne veš kaj je wide spread beaver al pa kakšna podobna bolj vsakdanja fraza - to ti seveda tud za v slovenščino koristi :D sam ti lahko kako stvar zelo čudno in neuporabno prevedeš v jezik, ki ga nisi navajen
"Figures don't lie, but liars figure."
Samuel Clemens aka Mark Twain
1
2
»


Vredno ogleda ...

TemaSporočilaOglediZadnje sporočilo
TemaSporočilaOglediZadnje sporočilo
»

Človeški jezik (strani: 1 2 )

Oddelek: Znanost in tehnologija
738981 (5296) kuall
»

Google razvija ribo babilonko

Oddelek: Novice / Apple iPhone/iPad/iPod
268285 (6918) Jst
»

Aplikacija za tolmačenje na iPhonu

Oddelek: Novice / Apple iPhone/iPad/iPod
173281 (2653) romci
»

Google govori 41 jezikov

Oddelek: Novice / Omrežja / internet
305247 (3967) Azrael
»

Presis prevajalni sistem

Oddelek: Programska oprema
123319 (2994) dunda

Več podobnih tem