» »

NSA zmore zapisati večino pogovorov

NSA zmore zapisati večino pogovorov

The Inercept - The Intercept je objavil nove dokumente iz Snowdnovega svežnja, ki pričajo o sposobnostih NSA pri prepoznavi govora in njegovega zapisa. Čeprav se je že dlje časa špekuliralo, da NSA zmore prepisati posnetke prestreženih telefonskih pogovorov, smo šele sedaj dobili trdne dokaze, da je tehnologija že zelo razvita, praksa pa zelo razširjena.

NSA je že leta 2006 razpolaga s tehnologijo, ki so jo interno imenovali Google for Voice. Prisluškovanje telefonskim pogovorom od nekdaj sodi med osnovne dejavnosti NSA, a donedavna so vedno potrebovali človeka, ki je pogovor poslušal in zapisal vsebino. To je pomenilo, da lahko obravnavajo zgolj zanemarljiv del vseh svetovnih pogovorov. Tehnologija to spreminja. Popolna transkripcija sicer še ni mogoča, so pa trenutni sistemi temu že dovolj blizu, da lahko sami zapišejo večino govorjenega, poiščejo ključne besede in ocenijo temo pogovora. Zato ni presenetljivo, da je DARPA že v 70. letih začela finančno podpirati raziskave prepoznavanje govora. Ne pozabimo pa niti, da NSA recimo prisluškuje vsem telefonskim klicem na Bahamih.

Najlaže gre seveda pri lepo govorjenem besedilu, kar so poročila. NSA ima sistem EViTAP, ki počne točno to - analizira vsebine novic v arabščini, kitajščini, ruščini, španščini, angleščini in perzijščini. Najbolje gre v španščini. Pisana paleta jezikov dokazuje, da slovenščina ni tako težak jezik, da bi bilo prepoznavanje nemogoče, le dovolj nezanimiv je, da se tega še niso lotili. Sistem za transkripcijo poročil lahko celo kupite v NSA-jevem diskontu. Kako daleč pa so s tehnologijo za prisluškovanje običajnim hreščečim telefonskim pogovorom v dialektih, pa ni znano. Gotovo so že zelo daleč.

50 komentarjev

strani: « 1 2

njyngs ::

Good luck s slovenskimi narečji, sploh s temi v našem koncu :)

Edit: ko bo seveda podprta slovenščina.

Zgodovina sprememb…

  • spremenil: njyngs ()

black ice ::

Never say never. Ostaja le še vprašanje časa.

Matthai ::

Slovenščina je že podprta. AI Lab na IJS trenutno dokončuje projekt Translectures. Iz video/audio zapisov se delajo samodejne transkripcije in prevodi v druge jezike. Slovenščina je podprta in že sedaj dela razmeroma dobro. Tako da tehnologija že obstaja. Ali jo ima tudi NSA je pa drugo vprašanje.

Kot zanimivost. V Translectures projektu se je izkazalo, da je odstotek napak pri izdelavi transkriptov najmanjši pri španskem jeziku. Mislim, da smo prišli na 92%+ natančnost. Ljudje imajo sicer 96%+ natančnost.
All those moments will be lost in time, like tears in rain...
Time to die.

Mr.B ::

njyngs, google zna to kar dobro.. Načeloma pa morajo naučiti avtomatiko prepozavanja govora cca 10 slovenkih oseb, pa vejo vse kaj in kako se lahko dogaja v Sloweniji...
Ignoranca JS, da poskrbi za lastno pokojnino,
je neodgovorna. Ampak sej veste jamrati po toči je...

black ice ::

Samo 10? V mislih sem imel majhno število, ampak tako majhno...

celada ::

Matthai je izjavil:

Slovenščina je že podprta. AI Lab na IJS trenutno dokončuje projekt Translectures. Iz video/audio zapisov se delajo samodejne transkripcije in prevodi v druge jezike. Slovenščina je podprta in že sedaj dela razmeroma dobro. Tako da tehnologija že obstaja. Ali jo ima tudi NSA je pa drugo vprašanje.

Kot zanimivost. V Translectures projektu se je izkazalo, da je odstotek napak pri izdelavi transkriptov najmanjši pri španskem jeziku. Mislim, da smo prišli na 92%+ natančnost. Ljudje imajo sicer 96%+ natančnost.


Ok kaj je pa štos tega, da ima španski jezik najmanj napak v obeh sistemih?
Asus p5q-pro, 1,5 TB Segate Baraccuda , Sapphire Ati radeon 4850
Core 2 Duo E8400 4Gb rama

black ice ::

Mehika, Baskija? Zgolj ugibam.

tikitoki ::

Glede nato, da je slovenki jezik fonetičen, mislim, da je precej lažje, kot za marsikater drug jezik. Zato je izjava, da slovenščina ni tako težak jezik za tovrstne aktivnosti, res mal glupa.

Matthai ::

celada je izjavil:

Ok kaj je pa štos tega, da ima španski jezik najmanj napak v obeh sistemih?

Ne vem. Mogoče imajo najbolj razvite tehnologije ter najbolj natreniran model. Mogoče je španski jezik že sam po sebi tak, da se da model najbolj natrenirati nanj.

Jaz sicer vem kaj so delali pri nas, da so tako dobro natrenirali sistem, v bistvu so kar dobre trike uporabili. Pri slovenščini je sicer problem, da manjka en layer tehnologij vmes, tako da sistem analize slovenskega govora še ni do konca razvit. Se pa aktivno dela na tem.
All those moments will be lost in time, like tears in rain...
Time to die.

Fritz ::

Ob rednem dotoku teh informacij smo že čisto otopeli oz. se nam zdi normalno dejstvo, da so zmogljivosti NSA že zdavnaj prekosile nekdanji vzhodnonemški StaSi. Reagan je zaradi takšnih nedemokratičnih praks poimenoval sovjetski blok 'The empire of evil'.
"Težav ne moremo reševati z isto miselnostjo,
kot smo jo imeli, ko smo jih ustvarili."
A. Einstein

Phantomeye ::

jap google now je že sposoben zaznave slovenskega jezika. Je pa res, da ni mogoča hkratna zaznava slovenskega in angleškega jezika, recimo da v enem stavku uporabiš oba jezika.

GTX970 ::

Phantomeye je izjavil:

jap google now je že sposoben zaznave slovenskega jezika. Je pa res, da ni mogoča hkratna zaznava slovenskega in angleškega jezika, recimo da v enem stavku uporabiš oba jezika.

Wrong.
Vrži tole v translate.google.com, opcija zaznaj jezik:
Je pa res, da ni mogoča simultaneous zaznava slovenskega in angleškega language, recimo da v enem sentence uporabiš oba jezika.


Čisto lepo prevede v ang.

Strojno prevajanje ima težave samo s kako zelo narečno prekmurščino, idrijščino ali pohorščino.

Zgodovina sprememb…

  • spremenilo: GTX970 ()

Irbis ::

Po mojem je problem če mešaš jezika v govoru, če pišeš, ima najbrž manj težav.
Čeprav se tudi pri pisanju da napisati tako, da se prevajalnik lepo zmede:
Ne morš rečt da je prestavljanje z mašino tko zihr.
Google Translate: Not Morse rečt that the shift from a tape machine tko IHR.
Presis pa takole: Not be able to to say that moving is so certain by a car.

Isotropic ::

po besedah whistleblowerja so preobremenjeni s podatki in posledično manj učinkoviti.

MrStein ::

Matthai je izjavil:


Kot zanimivost. V Translectures projektu se je izkazalo, da je odstotek napak pri izdelavi transkriptov najmanjši pri španskem jeziku. Mislim, da smo prišli na 92%+ natančnost. Ljudje imajo sicer 96%+ natančnost.

Kateri ljudje?
Eni vse razumejo (ali se vsaj uspešno pretvarjajo...) drugim treba ponoviti.
Teštiram če delaž - umlaut dela: ä ?

gzibret ::

Isotropic je izjavil:

po besedah whistleblowerja so preobremenjeni s podatki in posledično manj učinkoviti.


Žal bodo s časom tudi to porihtal.
Vse je za neki dobr!

no comment ::

gzibret je izjavil:

Isotropic je izjavil:

po besedah whistleblowerja so preobremenjeni s podatki in posledično manj učinkoviti.


Žal bodo s časom tudi to porihtal.

Žal?!

Končno se bodo zarote spet kovale v oštarijah ob dobri hrani in vinu. Tako tudi nezarotnikom kapne malo dobička od teh poslov...

Jupito ::

no comment je izjavil:

gzibret je izjavil:

Isotropic je izjavil:

po besedah whistleblowerja so preobremenjeni s podatki in posledično manj učinkoviti.


Žal bodo s časom tudi to porihtal.

Žal?!

Končno se bodo zarote spet kovale v oštarijah ob dobri hrani in vinu. Tako tudi nezarotnikom kapne malo dobička od teh poslov...


Ja, bomo pa za dober denar še oštarije ožičili z mikrofoni in kamerami, da vas piratski pedoteroristi ne bodo snedli s kožo in kostmi! :D
I used to be with it, but then they changed what it was.
Now what I'm with isn't it and what's it seems weird
and scary to me. It'll happen to you!

vostok_1 ::

Fritz je izjavil:

Ob rednem dotoku teh informacij smo že čisto otopeli oz. se nam zdi normalno dejstvo, da so zmogljivosti NSA že zdavnaj prekosile nekdanji vzhodnonemški StaSi. Reagan je zaradi takšnih nedemokratičnih praks poimenoval sovjetski blok 'The empire of evil'.


Stasi je lahko le sanjala o taki tehnologiji.

Trololololol ::

GTX970 je izjavil:

Phantomeye je izjavil:

jap google now je že sposoben zaznave slovenskega jezika. Je pa res, da ni mogoča hkratna zaznava slovenskega in angleškega jezika, recimo da v enem stavku uporabiš oba jezika.

Wrong.
Vrži tole v translate.google.com, opcija zaznaj jezik:
Je pa res, da ni mogoča simultaneous zaznava slovenskega in angleškega language, recimo da v enem sentence uporabiš oba jezika.


Čisto lepo prevede v ang.

Strojno prevajanje ima težave samo s kako zelo narečno prekmurščino, idrijščino ali pohorščino.

Ne, strojno prevajanje ima problem z vsemi narečji v Sloveniji.
Z nemščino nimajo problem, ker se na severu Nemčije in jugu Avstrije vseeno govori še dokaj podoben jezik.
Pri nas se pa že na poti iz Prekmurja do Lublane 3x izgubiš.

GupeM ::

Irbis je izjavil:

Po mojem je problem če mešaš jezika v govoru, če pišeš, ima najbrž manj težav.
Čeprav se tudi pri pisanju da napisati tako, da se prevajalnik lepo zmede:
Ne morš rečt da je prestavljanje z mašino tko zihr.
Google Translate: Not Morse rečt that the shift from a tape machine tko IHR.
Presis pa takole: Not be able to to say that moving is so certain by a car.

V tem primeru si res napisal toliko slengovskih besed da je logično da ne zna prevest. Bolj zanimiv mi je stavek:
"Mačka imaš, če si prejšnjo noč pil."
Google ga prevede v:
"The cat got if you drank last night."

Medtem ko stavek "Če piješ, imaš naslednji dan mačka." skoraj v redu prevede v "If you drink, do you have the next day hangover."

7982884e ::

Fritz je izjavil:

Ob rednem dotoku teh informacij smo že čisto otopeli oz. se nam zdi normalno dejstvo, da so zmogljivosti NSA že zdavnaj prekosile nekdanji vzhodnonemški StaSi. Reagan je zaradi takšnih nedemokratičnih praks poimenoval sovjetski blok 'The empire of evil'.

obstaja razlika med prisluskovanjem in cenzuro, ves. bi res raje videl, da te stasi ujame pri kritiziranju vlade kot nsa?

Irbis ::

> V tem primeru si res napisal toliko slengovskih besed da je logično da ne zna prevest.

Seveda, hotel sem pokazati, da se da napisati tako, da računalnik ne razume.
Ampak po drugi strani se iz Presisovega prevoda vidi, da se na to ne bo dalo več dolgo zanašati. Za nestandardno slovenščino je npr. trenutno v teku tudi projekt Janes: http://nl.ijs.si/janes/

> "Mačka imaš, če si prejšnjo noč pil."
> Google ga prevede v:
> "The cat got if you drank last night."

Tukaj se pa lepo vidi, da ima Google težave z besednim redom, ker ga zmede predmet pred glagolom.

Utk ::

Sej niti ta prevod načeloma ni napačen. Če rečeš, "ta avto je bomba", lahko si terorist, lahko pa ne...ampak ziher je ziher :)

BlackMaX ::

Še vedno je uporaba slenga, katera lahko predstavi nekaj preglavic.

Fritz ::

7982884e je izjavil:

Fritz je izjavil:

Ob rednem dotoku teh informacij smo že čisto otopeli oz. se nam zdi normalno dejstvo, da so zmogljivosti NSA že zdavnaj prekosile nekdanji vzhodnonemški StaSi. Reagan je zaradi takšnih nedemokratičnih praks poimenoval sovjetski blok 'The empire of evil'.

obstaja razlika med prisluskovanjem in cenzuro, ves. bi res raje videl, da te stasi ujame pri kritiziranju vlade kot nsa?

A misliš, da so razni milejši prekrški (recimo nakup mehkih drog ali kopiranje digitalnih vsebin) v ZDA obravnavani milejše kot povprečni dolgojezični 'oporečnik' v DDR? Pa tudi cenzura se vse bolj pogosto pojavlja - pod pretvezo boja proti terorizmu ali nečesa že (glej primer Francije).
"Težav ne moremo reševati z isto miselnostjo,
kot smo jo imeli, ko smo jih ustvarili."
A. Einstein

Ahiles ::

Španščina je najbol dodelana zato ker so začeli z uporabo teh sistemov proti kartelom iz mehike in južne amerike za prestrezanje drog. In posledično zadevo tolk močno izpilil.

erunno ::

Fritz je izjavil:

7982884e je izjavil:

Fritz je izjavil:

Ob rednem dotoku teh informacij smo že čisto otopeli oz. se nam zdi normalno dejstvo, da so zmogljivosti NSA že zdavnaj prekosile nekdanji vzhodnonemški StaSi. Reagan je zaradi takšnih nedemokratičnih praks poimenoval sovjetski blok 'The empire of evil'.

obstaja razlika med prisluskovanjem in cenzuro, ves. bi res raje videl, da te stasi ujame pri kritiziranju vlade kot nsa?

A misliš, da so razni milejši prekrški (recimo nakup mehkih drog ali kopiranje digitalnih vsebin) v ZDA obravnavani milejše kot povprečni dolgojezični 'oporečnik' v DDR? Pa tudi cenzura se vse bolj pogosto pojavlja - pod pretvezo boja proti terorizmu ali nečesa že (glej primer Francije).


To je vse še vedno kaplja v more v primerjavi za rusijo, ker je kakršna koli pritivladna vsebina obravnanava, brez kakšnega koli pretiravanja, dobesedno kot terrorizem. Če si klasičen medij, si ne upajo zapreti celega takoj. Bodo pa našli kak izgovor, ali pa mu bodo preprečiči dobivati dohodke, če si sp spletni portal kakor slo-tech, boš pa slej (odvosno od pomembnosti, utegnejo najprej z majhnimi ukrepi, kakor je brisanje posameznih postov, ali blokiranjem uporabnikov) ali prej zgasnil, z odgovornim v zaporu.

http://www.theguardian.com/world/2014/a...
http://www.rferl.org/content/russia-sep...

Te ljudi vaša sveta trojica podpira.

smash ::

Matthai je izjavil:

celada je izjavil:

Ok kaj je pa štos tega, da ima španski jezik najmanj napak v obeh sistemih?

Ne vem. Mogoče imajo najbolj razvite tehnologije ter najbolj natreniran model. Mogoče je španski jezik že sam po sebi tak, da se da model najbolj natrenirati nanj.

Jaz sicer vem kaj so delali pri nas, da so tako dobro natrenirali sistem, v bistvu so kar dobre trike uporabili. Pri slovenščini je sicer problem, da manjka en layer tehnologij vmes, tako da sistem analize slovenskega govora še ni do konca razvit. Se pa aktivno dela na tem.


a bo ta zadeva za slovenščino opensource? ker se kar bojim pomisliti na število aplikacij, ki bi z veseljem uporabile tak slo modul v svojih aplikacijah

glede na to, da je to delo IJS-ja bi pa sploh moralo biti javno dobro

mzakelj ::

evo iz ljubljanščine v eng : :):))

zjutraj je še dogija vokal, popoldne je v depro padu, zvečer pa se z rufa skenslal

morning is dogija vocals afternoon in Depro fall evening with rufa skenslal

Zgodovina sprememb…

  • predlagal izbris: echo ()

hamez66 ::

Si se zmotil in namesto retardščina napisal ljubljanščina? Tako nihče ne govori, če pa, je pa čas, da se vzamejo (te) v roke.

7982884e ::

Fritz je izjavil:

7982884e je izjavil:

Fritz je izjavil:

Ob rednem dotoku teh informacij smo že čisto otopeli oz. se nam zdi normalno dejstvo, da so zmogljivosti NSA že zdavnaj prekosile nekdanji vzhodnonemški StaSi. Reagan je zaradi takšnih nedemokratičnih praks poimenoval sovjetski blok 'The empire of evil'.

obstaja razlika med prisluskovanjem in cenzuro, ves. bi res raje videl, da te stasi ujame pri kritiziranju vlade kot nsa?

A misliš, da so razni milejši prekrški (recimo nakup mehkih drog ali kopiranje digitalnih vsebin) v ZDA obravnavani milejše kot povprečni dolgojezični 'oporečnik' v DDR? Pa tudi cenzura se vse bolj pogosto pojavlja - pod pretvezo boja proti terorizmu ali nečesa že (glej primer Francije).

a dej no. cel redneck bible part del amerike ima obamo za socialista, za žida, za komunista, tudi za opico; v teksasu te dni poteka veliko gibanje tinfoilovcev ki so prepričani da bo neka vojaška vaja, ki jo bodo izvajali, namenjena vaji za kontrolo prebivalstva; ogromno ljudi (civilistov) v zda naokoli hodi z nabitimi jurišnimi puškami (ker lahko) in ima doma razpobežene zastave konfederacije. primerjanje prisluškovanja NSA s tem, kar je delal stasi, ko je bil sum soseda o napačnem mišljenju zadosti, da si šel v prevzgojo, je navadno bluzenje.

Zgodovina sprememb…

  • spremenilo: 7982884e ()

francek1 ::

Trololololol je izjavil:

GTX970 je izjavil:

Phantomeye je izjavil:

jap google now je že sposoben zaznave slovenskega jezika. Je pa res, da ni mogoča hkratna zaznava slovenskega in angleškega jezika, recimo da v enem stavku uporabiš oba jezika.

Wrong.
Vrži tole v translate.google.com, opcija zaznaj jezik:
Je pa res, da ni mogoča simultaneous zaznava slovenskega in angleškega language, recimo da v enem sentence uporabiš oba jezika.


Čisto lepo prevede v ang.

Strojno prevajanje ima težave samo s kako zelo narečno prekmurščino, idrijščino ali pohorščino.

Ne, strojno prevajanje ima problem z vsemi narečji v Sloveniji.
Z nemščino nimajo problem, ker se na severu Nemčije in jugu Avstrije vseeno govori še dokaj podoben jezik.
Pri nas se pa že na poti iz Prekmurja do Lublane 3x izgubiš.

Ti očitno še nisi govoril s kakim štajerskim kmetom, iz avstrijske Štajerske mislim, ne? Njih še domačini iz Gradca ne razumejo! Pri nas so pa zmagovalci Haložani.
Kdor se je že rodil učen se lahko reži...

Fritz ::

erunno je izjavil:

Fritz je izjavil:

7982884e je izjavil:

Fritz je izjavil:

Ob rednem dotoku teh informacij smo že čisto otopeli oz. se nam zdi normalno dejstvo, da so zmogljivosti NSA že zdavnaj prekosile nekdanji vzhodnonemški StaSi. Reagan je zaradi takšnih nedemokratičnih praks poimenoval sovjetski blok 'The empire of evil'.

obstaja razlika med prisluskovanjem in cenzuro, ves. bi res raje videl, da te stasi ujame pri kritiziranju vlade kot nsa?

A misliš, da so razni milejši prekrški (recimo nakup mehkih drog ali kopiranje digitalnih vsebin) v ZDA obravnavani milejše kot povprečni dolgojezični 'oporečnik' v DDR? Pa tudi cenzura se vse bolj pogosto pojavlja - pod pretvezo boja proti terorizmu ali nečesa že (glej primer Francije).


To je vse še vedno kaplja v more v primerjavi za rusijo, ker je kakršna koli pritivladna vsebina obravnanava, brez kakšnega koli pretiravanja, dobesedno kot terrorizem. Če si klasičen medij, si ne upajo zapreti celega takoj. Bodo pa našli kak izgovor, ali pa mu bodo preprečiči dobivati dohodke, če si sp spletni portal kakor slo-tech, boš pa slej (odvosno od pomembnosti, utegnejo najprej z majhnimi ukrepi, kakor je brisanje posameznih postov, ali blokiranjem uporabnikov) ali prej zgasnil, z odgovornim v zaporu.

http://www.theguardian.com/world/2014/a...
http://www.rferl.org/content/russia-sep...

Te ljudi vaša sveta trojica podpira.

Rusija se ne razglaša za nevemkakšno demokracijo, kar za ZDA in Francijo ni možno reči. Mene osebno bolj skrbi dogajanje v ZDA in Franciji, ker vsi skupaj spadamo države zahoda in se med temi državami se takšne prakse veselo širijo.
"Težav ne moremo reševati z isto miselnostjo,
kot smo jo imeli, ko smo jih ustvarili."
A. Einstein

Trololololol ::

francek1 je izjavil:

Trololololol je izjavil:

GTX970 je izjavil:

Phantomeye je izjavil:

jap google now je že sposoben zaznave slovenskega jezika. Je pa res, da ni mogoča hkratna zaznava slovenskega in angleškega jezika, recimo da v enem stavku uporabiš oba jezika.

Wrong.
Vrži tole v translate.google.com, opcija zaznaj jezik:
Je pa res, da ni mogoča simultaneous zaznava slovenskega in angleškega language, recimo da v enem sentence uporabiš oba jezika.


Čisto lepo prevede v ang.

Strojno prevajanje ima težave samo s kako zelo narečno prekmurščino, idrijščino ali pohorščino.

Ne, strojno prevajanje ima problem z vsemi narečji v Sloveniji.
Z nemščino nimajo problem, ker se na severu Nemčije in jugu Avstrije vseeno govori še dokaj podoben jezik.
Pri nas se pa že na poti iz Prekmurja do Lublane 3x izgubiš.

Ti očitno še nisi govoril s kakim štajerskim kmetom, iz avstrijske Štajerske mislim, ne? Njih še domačini iz Gradca ne razumejo! Pri nas so pa zmagovalci Haložani.

Haloze razumem, štajersko tudi, Ljubljano tudi, Primorje tudi, Prekmurje srednje slabo. Vsi ostali mene ne razumejo.

MrStein ::

7982884e je izjavil:


a dej no. cel redneck bible part del amerike ima obamo za socialista, za žida, za komunista, tudi za opico; v teksasu te dni poteka veliko gibanje tinfoilovcev ki so prepričani da bo neka vojaška vaja, ki jo bodo izvajali, namenjena vaji za kontrolo prebivalstva; ogromno ljudi (civilistov) v zda naokoli hodi z nabitimi jurišnimi puškami (ker lahko) in ima doma razpobežene zastave konfederacije. primerjanje prisluškovanja NSA s tem, kar je delal stasi, ko je bil sum soseda o napačnem mišljenju zadosti, da si šel v prevzgojo, je navadno bluzenje.

Odvisno od definicije "napačnega mišljenja".
Za nošenje puške res ne bo noben tam šel v zapor. Ampak poskusi z malo belega praška ali čim drugim "nedolžnim" okoli hodit, pa poročaj. Ali pa recimo z flaško vode na letalo.
Teštiram če delaž - umlaut dela: ä ?

Phantomeye ::

GTX970 je izjavil:

Phantomeye je izjavil:

jap google now je že sposoben zaznave slovenskega jezika. Je pa res, da ni mogoča hkratna zaznava slovenskega in angleškega jezika, recimo da v enem stavku uporabiš oba jezika.

Wrong.
Vrži tole v translate.google.com, opcija zaznaj jezik:
Je pa res, da ni mogoča simultaneous zaznava slovenskega in angleškega language, recimo da v enem sentence uporabiš oba jezika.


Čisto lepo prevede v ang.



Mogoče pa TI nisi sposoben zaznave slovenskega jezika. Preden mi pišeš Wrong, vsaj preberi, kaj sem napisal.

Napisal sem, da Google Now ne omogoča zaznave različnih jezikov v enem glasovnem ukazu. Torej, da rečeš OK Google, Search for Prešernovo gledališče - bo zaznalo 'search for' neki neki ali pa bo zaznalo neki neki 'prešernovo gledališče'.

Čeprav zdaj tudi to nekaj izboljšujejo.

StarMafijec ::

Trololololol je izjavil:

Z nemščino nimajo problem, ker se na severu Nemčije in jugu Avstrije vseeno govori še dokaj podoben jezik.

Podoben? Zakaj imajo pa npr. nemškogovoreči narodi več wikipedij?

http://de.wikipedia.org/
http://als.wikipedia.org/
http://bar.wikipedia.org/
http://lb.wikipedia.org/
http://pdc.wikipedia.org/
http://ksh.wikipedia.org/
http://nds.wikipedia.org/

7982884e ::

MrStein je izjavil:

7982884e je izjavil:


a dej no. cel redneck bible part del amerike ima obamo za socialista, za žida, za komunista, tudi za opico; v teksasu te dni poteka veliko gibanje tinfoilovcev ki so prepričani da bo neka vojaška vaja, ki jo bodo izvajali, namenjena vaji za kontrolo prebivalstva; ogromno ljudi (civilistov) v zda naokoli hodi z nabitimi jurišnimi puškami (ker lahko) in ima doma razpobežene zastave konfederacije. primerjanje prisluškovanja NSA s tem, kar je delal stasi, ko je bil sum soseda o napačnem mišljenju zadosti, da si šel v prevzgojo, je navadno bluzenje.

Odvisno od definicije "napačnega mišljenja".
Za nošenje puške res ne bo noben tam šel v zapor. Ampak poskusi z malo belega praška ali čim drugim "nedolžnim" okoli hodit, pa poročaj. Ali pa recimo z flaško vode na letalo.
čestitke za super analogijo.
aja, pa vodo na letalo sem že poskusil švercat (sicer nenamerno, pa ni bilo v ameriki). čudno me je pogledal un možakar, jo stran zlil, pa mi jo dal nazaj. ampak hej, verjetno greš pa v ameriki za tak zločin direktno v guantanamo.

Zgodovina sprememb…

  • spremenilo: 7982884e ()

MrStein ::

En je rekel na drugem koncu sveta, da bi ubil predsednika, pa je šel v zapor.
Mižati is bliss, kajne?
Teštiram če delaž - umlaut dela: ä ?

Fritz ::

7982884e je izjavil:

Fritz je izjavil:

7982884e je izjavil:

Fritz je izjavil:

Ob rednem dotoku teh informacij smo že čisto otopeli oz. se nam zdi normalno dejstvo, da so zmogljivosti NSA že zdavnaj prekosile nekdanji vzhodnonemški StaSi. Reagan je zaradi takšnih nedemokratičnih praks poimenoval sovjetski blok 'The empire of evil'.

obstaja razlika med prisluskovanjem in cenzuro, ves. bi res raje videl, da te stasi ujame pri kritiziranju vlade kot nsa?

A misliš, da so razni milejši prekrški (recimo nakup mehkih drog ali kopiranje digitalnih vsebin) v ZDA obravnavani milejše kot povprečni dolgojezični 'oporečnik' v DDR? Pa tudi cenzura se vse bolj pogosto pojavlja - pod pretvezo boja proti terorizmu ali nečesa že (glej primer Francije).

a dej no. cel redneck bible part del amerike ima obamo za socialista, za žida, za komunista, tudi za opico; v teksasu te dni poteka veliko gibanje tinfoilovcev ki so prepričani da bo neka vojaška vaja, ki jo bodo izvajali, namenjena vaji za kontrolo prebivalstva; ogromno ljudi (civilistov) v zda naokoli hodi z nabitimi jurišnimi puškami (ker lahko) in ima doma razpobežene zastave konfederacije. primerjanje prisluškovanja NSA s tem, kar je delal stasi, ko je bil sum soseda o napačnem mišljenju zadosti, da si šel v prevzgojo, je navadno bluzenje.

Lej, večina ljudi ima kakšno skrivnost ali pa občasno ušpiči kakšno neumnost. Kak prekršek, kakšno prevaro, kinky sex...karkoli že. Če se vam zdi normalno, da neka državna služba podatke o vsem tem veselo nabira, da bi jih lahko kadarkoli in kakorkoli uporabila proti tebi, fino. Meni se to ne zdi prav in mislim, da se tudi piscem Ustave RS (tudi Ustave ZDA, če smo že pri tem) to ni zdelo prav. Kdo pa pravi, da bomo imeli vedno bolj demokratične režime od Rusov, Kitajcev in podobnih?
Poleg tega so v ZDA celo našli in zaprli nekega delavca, ki je bil obtožen pošiljanja denarja nekim ekstremističnim skupinam. Če bo obsojen...a se ti morda zdijo ameriški zapori kaj bolj humani od tistih v nekdanjem vzhodnem bloku?
"Težav ne moremo reševati z isto miselnostjo,
kot smo jo imeli, ko smo jih ustvarili."
A. Einstein

borisk ::

Trololololol je izjavil:


Z nemščino nimajo problem, ker se na severu Nemčije in jugu Avstrije vseeno govori še dokaj podoben jezik.
Pri nas se pa že na poti iz Prekmurja do Lublane 3x izgubiš.


to seveda ni res, obstaja celo avstrijsko nemški slovar, z neko ogromno številko gesel. Če poslušaš nekoga iz austrijskie štajerske, enaga bavarca in enga severnjaka, bi mislil, da ne govorijo nemščine.

GTX970 ::

borisk
Pri naštevanju si pozabil dodati Švicarje :).

c3p0 ::

Slej ali prej noben prevod ne bo težaven, že zdaj večinoma ni. Na podlagi par ključnih besed se pogovor lahko tudi flagga, nato ga analizira človek. Kriminalci pa itak govorijo bolj v kodah, bi rekel.

Raje se bi skoncentrirali na end to end voice encryption, zakaj ga še ni in kaj se tukaj obeta?

Matthai ::

Itak pa ne rabijo narediti popolnega transkripta. Dovolj je, da se zadeva ustrezno kategorizira in potaga, poleg tega se zraven vključi še social network analytics, pa imaš že zelo zmogljivo orodje za detekcijo "teroristov" / vohunsko špijonažo.
All those moments will be lost in time, like tears in rain...
Time to die.

erunno ::

Fritz je izjavil:

Rusija se ne razglaša za nevemkakšno demokracijo, kar za ZDA in Francijo ni možno reči. Mene osebno bolj skrbi dogajanje v ZDA in Franciji, ker vsi skupaj spadamo države zahoda in se med temi državami se takšne prakse veselo širijo.


Govori pa se tukaj na Slo-Tech, kakor da je samo zahod tisti ki to počne. Poleg tega pa se zelo motiš če misliš da smo varni, pred tem da bi se to razširlo iz Vzhoda (sploh pa v naši sloveniji, ker ima zelo velik vpliv lobi, ki ima financčno-poslovne povezave z Rusijo).
Uradno se sicer RF obravnava kot demokractično republiko.

andmer99 ::

nimam časa komentirati vseh stvari ločeno, zato bom za razjasnitev par glavnih stvari vse napisal kar skupaj:

1.) razpoznavanje govora - torej iz posnetka dobiti besedilo, kar je to kar je opisana zadeva NSA (in pa recimo Google Now) in pa prevajanje besedila iz enega jezika v drugega (Google translate, Presis, ali pa recimo projekt SUMAT za prevajanje podnapisov http://www.sumat-project.eu/) sta dve različni tehnologiji. Določene stvari imata sicer res sorodne, in lahko se ju poveže med seboj (kot recimo v IJS translectures ali pa v projektu TC-STAR), vendar potem pride do novih problemov.

2.) glede razpoznavanja govora za slovenščino (IJS translectures o katerem govori Matthai) je tako, da se raziskovalno dela na tem že kar nekaj časa (ugasnjeni komercialni sistemi M-Vstopnica, Vida, LentInfo). Komercialno najbolj izpiljen splošni sistem za slovenščino je trenutno Google Now, je pa pogosto odvisno od konteksta (govorec, narečje, besedišče, šumi iz okolja...), kako dobro deluje. Projekt Translectures pri katerem sodeluje IJS, delujejo dobro za slovenščino tudi zato, ker so uporabili en kup specifičnih prilagoditev, ki jih v splošnih sistemih (kot je ta NSA) ni možno uporabiti. Na primer: konstantno je isti govorec, ki predava zato se adaptira na njegov glas. Ker gre za predavanja, se adaptira vsaj na vsebino prosojnic predavanja oz. celo na vsebino članka ali učbenika če je ta dostopna. Praviloma gre za zborni jezik in pa za vnaprej pripravljen (praktično "bran") in ne spontan govor. Skratka čisto nekaj drugega, kot pa klasičen splošen telefonski pogovor, ki mu prisluškuje NSA. Podobno specifičen, ozko usmerjen sistem za slovenski jezik je narekovanje radioloških izvidov. Malo širši je pilot, ki so ga lani delali na sodišču, za narekovanje sodnikov.

3.) in še glede razlike med jeziki: španščina je eden izmed bolj hvaležnih jezikov za razpoznavanje govora, povezano je z značilnostmi jezika, predvsem kar se tiče fonemov in pa besedišča. Praviloma se v španščini dosega zelo dobre rezultate. Za nemščino je že zgoraj nekdo dobro razložil, da so seveda velike razlike v narečjih. Pojdi v Lučane ali Gomilico in poskusi z znanjem Hochdeutsch razumeti avstrijskoštajerskega Seppa. Tudi nemška Švica (ali pa južna Tirolska) je svoja kategorija - verjetno se je že kdo zavzel, da jih na nemških TV kanalih kar podnaslavljajo. Za razpoznavanje govora ima nemščina še eno lepo posebnost - zlepljanje besed (Grund­stücks­ver­kehrs­ge­neh­mi­gungs­zu­stän­dig­keits­über­tra­gungs­ver­ord­nung). Slovenščina je za razpoznavanje govora zahteven jezik - zakaj: pregibnost besed, prosti vrstni red besed v stavku, narečja, pretvorba iz črk v foneme... Plus, komercialno seveda ni preveč zanimiv.

4.) to kar počne NSA je vsekakor zelo izpiljena zadeva, ni zastonj DARPA eden izmed glavnih financerjev raziskva na tem področju že vsaj zadnjih 30 let.

Zgodovina sprememb…

  • spremenil: andmer99 ()

Jupito ::

erunno je izjavil:

Fritz je izjavil:

Rusija se ne razglaša za nevemkakšno demokracijo, kar za ZDA in Francijo ni možno reči. Mene osebno bolj skrbi dogajanje v ZDA in Franciji, ker vsi skupaj spadamo države zahoda in se med temi državami se takšne prakse veselo širijo.


Govori pa se tukaj na Slo-Tech, kakor da je samo zahod tisti ki to počne. Poleg tega pa se zelo motiš če misliš da smo varni, pred tem da bi se to razširlo iz Vzhoda (sploh pa v naši sloveniji, ker ima zelo velik vpliv lobi, ki ima financčno-poslovne povezave z Rusijo).
Uradno se sicer RF obravnava kot demokractično republiko.


Heh, "sovražnik mojega sovražnika je moj prijatelj" očitno še kar živi. Čeprav ni treba pogledati dosti nazaj v naši zgodovini, da bi se naučili, kako tragično se takšno "taktiziranje" lahko konča.
I used to be with it, but then they changed what it was.
Now what I'm with isn't it and what's it seems weird
and scary to me. It'll happen to you!

GTX970 ::

Ko je strojni prevod popolnoma napačen:
https://translate.google.com/#auto/en/jaz%20sem%20sku%C5%A1trana
strani: « 1 2


Vredno ogleda ...

TemaSporočilaOglediZadnje sporočilo
TemaSporočilaOglediZadnje sporočilo
»

NSA zmore zapisati večino pogovorov (strani: 1 2 )

Oddelek: Novice / NWO
5017823 (13538) 7982884e
»

NSA zmore zbrati prometne podatke za manj kot tretjino mobilnih klicev v ZDA

Oddelek: Novice / NWO
95848 (4253) Iatromantis
»

Snowden zadovoljen s svojo misijo, NSA se utaplja v podatkih

Oddelek: Novice / Zasebnost
287291 (3999) k4vz0024
»

NSA v prostem času prisluškuje za zabavo (strani: 1 2 )

Oddelek: Novice / Zasebnost
799657 (5733) Matthai

Več podobnih tem