» »

Wikipedija v malih jezikih nezanesljiva: primer jezika scots

Wikipedija v malih jezikih nezanesljiva: primer jezika scots

Slo-Tech - Scots je eden izmed nacionalnih jezikov Škotske in dela Severne Irske, ki ga ne smemo zamenjevati s škotsko gelščino. Kot germanski jezik je v bližnjem sorodu z angleščino, a je vseeno dovolj različen, predvsem pa stabilen, da gre za polnokrven jezik. Od angleščine se razlikuje približno toliko, kot se norveščina od danščine. Jezik ima 1,5 milijona govorcev, v njem pa seveda obstaja tudi Wikipedija. In ta ima sedaj pred seboj neverjetno zagonetko.

Zadnjih osem let je namreč Wikipedijo v tem jeziku urejal uporabnik z vzdevkom AmaryllisGardener. Spisal je 23.000 člankov in uredil več kot 200.000 drugih člankov. Problem pri tem velikopoteznem urejanju pa predstavlja dejstvo, da uporabnik živi v ZDA in da nima pojma o jeziku scots. Članki, ki jih je "pripravljal" in "popravljal", vsebujejo polomljeno angleščino, v kateri so nekatere besede fonetično zapisane kakor bi se zapisale v jeziku scots. Med jeziki se seveda tako ne prevaja in rezultat je polomljena angleščina, ki nima s scots nič skupnega. Pravzaprav je neverjetno, da so to ugotovili šele sedaj.

Wikipedija je sedaj pred zelo nenavadnim problemom. Posameznik je bil daleč najbolj plodovit urejevalec Wikipedije v tem jeziku, ki je vplival na skoraj vse članke. Edina rešitev je bodisi izbris Wikipedije v tem jeziku ali vrnitev na stanje iz leta 2012. Obe rešitvi sta slabi, a tretje možnosti skorajda ni. Zanimivo je, da so se prva opozorila pojavljala že leta 2016, a Wikipedija ni ukrepala.

To postavlja vprašanje, kdo je Wikipedija. Na vsebinski ravni so Wikipedija uporabniki, ki pišejo in popravljajo članke, nekoliko več moči pa imajo administratorji. Medtem ko angleško Wikipedijo ureja na tisoče ljudi, je pri manjših jezikih problem resnejši. Tam lahko posameznik vihti nesorazmerno močan vpliv na Wikipedijo v tem jeziku, tako da preprosto napiše ali popravi večino člankov ali pa odžene vse konkurente. Hrvaška Wikipedija se zaradi tega na priemr sooča s problemom zgodovinskega revizionizma, ki traja že vrsto let. To seveda ni edini problem, je pa ilustracija, da je Wikipediji v nišnih jezikih teže zaupati. Google se tega ne zaveda, zato so zadetki iz Wikipedije pri vrhu. In to je lahko velik problem.

28 komentarjev

Gregor P ::

Edina rešitev je bodisi izbris Wikipedije v tem jeziku ali vrnitev na stanje iz leta 2012. Obe rešitvi sta slabi, a tretje možnosti skorajda ni.
Kja pa veliko rdeče opozorilo zgoraj, da je besedilo v polomljeni angleščini in trenutno v urejanju ter prošnja avtorjem za pomoč pri urejanju? Mislim, toliko, da ti ni treba ravno takoj izbrisati vse vsebine?:|

To seveda ni edini problem, je pa ilustracija, da je Wikipediji v nišnih jezikih teže zaupati.
Torej v tem primeru je problem zaupati v to, da je zapisano slovnično pravilno, vsebina je pa najbrž bila pravilna?
The main failure in computers is usually located between keyboard and chair.
You read what you believe and you believe what you read ...
Nisam čit'o, ali osudjujem (nisem bral, a obsojam).

Zgodovina sprememb…

  • spremenil: Gregor P ()

crystal ::

Pravzaprav je neverjetno, da so to ugotovili šele sedaj.

noben ne bere

mtosev ::

Še slovenska Wikipedija ni preveč uporabna, ker ima premalo vnosov. English Wiki je great.
Core i9 10900X, ASUS Prime X299 Edition 30, 32GB 4x8 3600Mhz G.skill, CM H500M,
ASUS ROG Strix RTX 2080 Super, Samsung 970 PRO, UltraSharp UP3017, Win 11 Pro,
Enermax Platimax 1700W | moj oče darko 1960-2016, moj labradorec max 2002-2013

Zgodovina sprememb…

  • spremenil: mtosev ()

opeter ::

mtosev je izjavil:

Še slovenska Wikipedija ni preveč uporabna, ker ima premalo vnosov. English Wiki je great.


Dragi Marko!
Zakaj pa ne prispevaš, da bi postala uporabna tudi za slovenske uporabnike?
Hrabri mišek (od 2015 nova serija!) -> http://tinyurl.com/na7r54l
18. november 2011 - Umrl je Mark Hall, "oče" Hrabrega miška
RTVSLO: http://tinyurl.com/74r9n7j

mtosev ::

En article sem celo ustvaril. Je pa stub trenutno.
Core i9 10900X, ASUS Prime X299 Edition 30, 32GB 4x8 3600Mhz G.skill, CM H500M,
ASUS ROG Strix RTX 2080 Super, Samsung 970 PRO, UltraSharp UP3017, Win 11 Pro,
Enermax Platimax 1700W | moj oče darko 1960-2016, moj labradorec max 2002-2013

Phantomeye ::

meni se zdi ful nenavadno, da je clovek sam sebi verjel, da je kompetenten pisat v tem jeziku, da je temu posvetil 8 let .... pa v teh osmih letih bi se lahko dejansko naučil jezika

hr_natakar ::

Vsak butelj lahk pise na wikipedio. To je raj za poneumljanje ljudi.

HotBurek ::

Včerišno-današnja cvetka pri gugl prevajanju.

Iz Slovenščine v Albanščino:
sir -> zotëri
sirni -> djathë

In nazaj v Slovenščino:
zotëri -> Gospod
djathë -> sir

Sir! Si prevedla sir? Fprašam te, si prevedla sir?!
root@debian:/# iptraf-ng
fatal: This program requires a screen size of at least 80 columns by 24 lines
Please resize your window

CyberPunk ::

Kot germanski jezik je v bližnjem sorodu z angleščino, a je vseeno dovolj različen, predvsem pa stabilen, da gre za polnokrven jezik.

Na tej podlagi bi lahko na območju slovenščine "ustanovili" kar nekaj polnokrvnih jezikov... :)) (dva sta sicer že).

Irbis ::

HotBurek je izjavil:

Včerišno-današnja cvetka pri gugl prevajanju.
Iz Slovenščine v Albanščino:
sir -> zotëri
sirni -> djathë

Googlov prevajalnik ima kdaj težave, ker gre vmes prek angleščine. In tukaj ima problem slovensko-angleški prevajalnik, ki prevede sir v sir :-) Potem gre pa to v zotëri, ker je gospod po albansko.

Gagatronix ::

CyberPunk je izjavil:

Kot germanski jezik je v bližnjem sorodu z angleščino, a je vseeno dovolj različen, predvsem pa stabilen, da gre za polnokrven jezik.

Na tej podlagi bi lahko na območju slovenščine "ustanovili" kar nekaj polnokrvnih jezikov... :)) (dva sta sicer že).


Skotska ima tri uradne jezike: Scots, English, Gaidhlig.

mtosev ::

V Indiji imajo več kot 15 uradnih jezikov.
Core i9 10900X, ASUS Prime X299 Edition 30, 32GB 4x8 3600Mhz G.skill, CM H500M,
ASUS ROG Strix RTX 2080 Super, Samsung 970 PRO, UltraSharp UP3017, Win 11 Pro,
Enermax Platimax 1700W | moj oče darko 1960-2016, moj labradorec max 2002-2013

Gagatronix ::

Indija nima enega splosnega uradnega jezika, ampak se uradni jeziki razlikujejo od zvezne drzave do zvezne drzave. Predstavljaj si, da bi ZDA imele razlicne uradne jezike v razlicnih zveznih drzavah, nekje na takem nivoju.

Phantomeye ::

Gagatronix je izjavil:

Indija nima enega splosnega uradnega jezika, ampak se uradni jeziki razlikujejo od zvezne drzave do zvezne drzave. Predstavljaj si, da bi ZDA imele razlicne uradne jezike v razlicnih zveznih drzavah, nekje na takem nivoju.


Mislim, sej ZDA tudi nima uradnjega jezika

Gagatronix ::

Uradnega*

In ja, res je. Nimajo uzakonjenega uradnega jezika, je pa angleski najbolj uporabljan.

hr_natakar ::

Prekmurscino bi komot dal v drug jezik, ker je skoraj nic ne razumem. Pomoje ljubljancan prej razume zagrebcana kot prekmurca, pa kao isti jezik.

Gagatronix ::

hr_natakar je izjavil:

Prekmurscino bi komot dal v drug jezik, ker je skoraj nic ne razumem. Pomoje ljubljancan prej razume zagrebcana kot prekmurca, pa kao isti jezik.


Slovenscina ima med 60 in 80 dialektov. Vsi se vedno spadajo pod slovenscino.

hr_natakar ::

Ce se gremo taksno logiko je praslovanscina od poljske prek balkana do bolgarije isti jezik, le z drugacnimi narecji. Vkljucno z slovenscino, slavonscino, slovascino in ostalimi slovanskimi jeziki.

Gagatronix ::

Ne, ker SCS ni vec ziv jezik.

hr_natakar ::

Gagatronix je izjavil:

Ne, ker SCS ni vec ziv jezik.

Sej v slovenscini so vsi jeziki pravzaprav narecja, le da je uradni knjizni jezik dogovoren. Se spomnite trubarscine in izumljanje knjiznega jezika. To je bil samo dogovor. To je umetna tvorevina. V bistvu navadni ljudje vsi govorijo lokalni jezik vkljucno z ljubljancani. To je vse isti jezik le drugacna narecja. Jaz se znam sporazumet s slovaki in cehi, tudi srbi, hrvati, celo ukrajinci in rusi, ce govorim po balkansko. Vi se ne morete z prekmurcem, pa je kao isti jezik kot vas.

Zgodovina sprememb…

Gagatronix ::

Povsod je knjizni jezik skupni dogovor. Zdaj si pa potegni betico iz anusa in vklopi svojo sivo celico.

blackbfm ::

hr_natakar je izjavil:

Vsak butelj lahk pise na wikipedio. To je raj za poneumljanje ljudi.


Ne, to so forumi kot je slo-tech

Utk ::

Phantomeye je izjavil:

Gagatronix je izjavil:

Indija nima enega splosnega uradnega jezika, ampak se uradni jeziki razlikujejo od zvezne drzave do zvezne drzave. Predstavljaj si, da bi ZDA imele razlicne uradne jezike v razlicnih zveznih drzavah, nekje na takem nivoju.


Mislim, sej ZDA tudi nima uradnjega jezika

A da ne? Se pravi lahko kjerkoli v ZDA karkoli opraviš tudi v slovenščini? Dobiš obrazce v slovenščini?

Gagatronix ::

Ne budaliraj, dobro ves kaj pomeni da uradni jezik ne obstaja. V ZDA zakonsko ni definiran uradni jezik, je pa najbolj pogosti angleski jezik.

Utk ::

Ne budaliraj. Če nikjer na zvezni ravni ne piše, da je ta in ta uradni jezik, ne pomeni, da to ne piše kje drugje. Kot da če ni zveznega zakona o vozniškem dovoljenju, da zato ne obstajajo tam vozniška dovoljenja. Recimo. Sigurno je še 100 primerov, ki nimajo predpisa čez cele ZDA, pa vseeno veljajo.

Gagatronix ::

Na federalni ravni angleski jezik NI definiran kot uradni jezik, so ga pa na ravni zveznih drzav nekatere definirale kot uradnega. Bizgec.

CyberPunk ::

Če me spomin ne vara, je bila pred dobrimi sto leti tudi nemščina na dobri poti postati uradni jezik v ZDA (ali en od teh). Sicer pa ne rabijo imeti definiranega "uradnega jezika", imajo pač angleščino (in nekje španščino) verjetno kot "delovni jezik" (kot v EU, ko imaš kup uradnih jezikov, med katere seveda spada tudi slovenščina, in par delovnih).

Glede prekmurščine sem jaz po enem tednu v glavnem vse razumel, ko sem enkrat imel cimra od tam... :))

Pri slovenskem knjižnem jeziku je problem, da so ga v današnji obliki uveljavili enkrat v 19. stoletju, ko je bila najbolj glasna pro-jugoslovanska miselnost tudi pri jezikoslovcih. Tako so vsilili LJ in NJ (kar še danes v veliki večini primerov zveni izumetničeno - najbolj očiten primer so krajevna imena, pri katerih vsaj lokalno prebivalstvo navadno ne uporablja LJ in NJ), zamenjali "nemški" ja z "ruskim" da, zamenjali cel kup besed z "nemškim" korenom s "slovanskimi" (ironija: Čehi in Slovaki, ki so bili precej bolj "ogroženi" s strani Nemcev kot Slovenci, so obdržali precej takih besed, ki naj bi bile germanskega izvora) itn. Namesto tega bi lahko črpali iz bogate zakladnice vseh narečij in govorov, ampak iskanje zaledja na jugovzhodu je bilo premočno...
(Najbrž bi bilo tudi precej zanimivo, ko bi Hrvati namesto hercegovskega govora za osnovo svojemu knjižnemu jeziku vzeli zagorski govor... >:D

Utk ::

Gagatronix je izjavil:

Na federalni ravni angleski jezik NI definiran kot uradni jezik, so ga pa na ravni zveznih drzav nekatere definirale kot uradnega. Bizgec.

Bizgec je tist, ki misli, da to karkoli spremeni. Na federalni ravni ni definirano niti vozniško dovoljenje. To pomeni, da ZDA ne poznajo vozniškega? Da lahko voziš brez? Bizgec.


Vredno ogleda ...

TemaSporočilaOglediZadnje sporočilo
TemaSporočilaOglediZadnje sporočilo
»

Wikipedija v malih jezikih nezanesljiva: primer jezika scots

Oddelek: Novice / Ostalo
285888 (3987) Utk
»

Italijanska Wikipedija začasno onemogočena

Oddelek: Novice / NWO
329656 (7353) IzidorAQ
»

Wikipedija praznuje 10 let

Oddelek: Novice / Omrežja / internet
216997 (5717) Tear_DR0P
»

Wikipedija zbrala 16 milijonov dolarjev donacij

Oddelek: Novice / Omrežja / internet
3712273 (9948) Jst
»

Wikipedia uvedla novo zaščito pred vandalizmom

Oddelek: Novice / Varnost
437418 (5875) Dragi

Več podobnih tem