» »

Milijoni znanstvenih člankov niso ustrezno arhivirani in lahko kmalu izginejo

Milijoni znanstvenih člankov niso ustrezno arhivirani in lahko kmalu izginejo

Slo-Tech - Osnovna valuta v znanstvenem establišmentu so znanstveni članki, ki podobno kot denar v ekonomiji opravljajo več funkcij. Po eni strani so poročila o raziskovalnem delu in zbirka znanja človeštva v sorazmerno surovi obliki, preden prečiščena pride v učbeniku, po drugi strani pa so zapis produktivnosti in kakovosti dela znanstvenikov in raziskovalcev. Razlogov, da jih želimo ohraniti za zanamce, je več, v svoji srži pa zanje velja podobno kot za knjige. A večina člankov dandanes že izide le v elektronskih revijah, zaradi česar so v večji nevarnosti, da nenadoma izginejo z obličja. To se že dogaja, ugotavljajo.

Raziskava, ki je bila objavljena v Journal of Librarianship and Scholarly Communication, je pokazala na hitro izgubljanje vsebin. Preverili so 7,4 milijona člankov, ki imajo unikatno številko DOI (digital object identifier). S tem enoličnim identifikatorjem bi moralo biti enostavno identificirati in najti članke ter ostale vsebine, ki dobijo DOI. To so tudi razna poglavja v knjigah, poročila itd. Vzorec v raziskavi so sestavili z naključnim izborom do tisoč del posameznega člana sistema Crossref - teh članov je okrog 20.000. Ugotovili so, da kar 28 odstotkov teh vsebin ni bilo možno več najti v spletnih arhivih - to je dva milijona vsebin. Preostanek je bil bodisi preveč nov (14 odstotkov), niso bili članki ali pa so bili članki, ki so bili v vsaj eni dostopni bazi (58 odstotkov).

Z drugimi besedami to pomeni, da je DOI sicer garancija, da lahko enolično identificiramo posamezno vsebino, ni pa to jamstvo za njeno dostopnost. Raziskava ne govori o plačljivih zidovih, temveč resničnem propadanju vsebin, kajti revije segajo od zelo uglednih do milo rečeno sumljivih ali celo garažnih, ki lahko nenadoma izginejo. Raziskava sicer ne trdi, da je dva milijona člankov že izginilo, temveč da niso primerno arhivirani in da lahko v prihodnosti res izginejo, če že niso doslej.

15 komentarjev

Evolve ::

tragedija

zee ::

Zato je pametno imeti digitalne kopije lastnih člankov. Mojih nekaj akademskih člankov živi na domačem NAS-u in v oblaku.
zee
Linux: Be Root, Windows: Re Boot
Giant Amazon and Google Compute Cloud in the Sky.

starfotr ::

Bolj kot sami članki so problem izvorne datoteke in rezultati za te članke. Tega že davno več ni za večino člankov.

In glede na to, da gre danes za hiper inflacijo (fake) člankov, neke hude škode tudi ni, če gre to v digitalna nebesa. Tisti pomembni se bodo tako ali tako obdržali.

Sicer pa gremo po poti idiokracije, članki so vedno manj potrebni.

In sumim, da se je znanstvena srenja odločila sodelovat v letošnji akciji reševalcev našega planeta in so digitalne odpadke začeli brisat.

https://digital.ocistimo.si/

zee ::

Izvorne datoteke in dodatne informacije (supplementary information) so tipično nedosegljive ali pomanjkljive že zdaj.
zee
Linux: Be Root, Windows: Re Boot
Giant Amazon and Google Compute Cloud in the Sky.

JanBrezov ::

Poznam primer, kjer gre za nekakšen dokumentni sistem, ki teče pri različnih strankah in hrani od deset do sto tisoč datotek, večinoma PDF, tudi članke. Metapodatki so v bazi, datoteke so v mapi na disku. Sistemi stojijo že 10+ let. Pri eni stranki so PDF-i začeli misteriozno izginjati. Torej metapodatki so bili, datoteke pa ne. Ni šlo za veliko datotek, od 10 do 20 manjkajočih datotek. Te datoteke so uspeli dobiti iz medpomnilnika mikroservisa, ki ima hrošča, ki ne briše tega medpomnilnika. V trenutku, ko so želeli prenesti te datoteke nazaj na strežnik stranke, so spet izginile, nakar so ugotovili, da jih briše antivirus. Tisti PDF-i so bili tam tudi po 5 let, a kar naenkrat se je antivirus odločil, da vsebujejo trojanca. Datoteke so preverili na VirusTotal, ki testira fajle na več različnih antivirusih hkrati in ni našel nič. Tiste fajle so potem poslali antivirusu kot false positive in potem je restore teh datotek uspel.

janezvalva° ::

v mislih imam decentralizirano trajno shranjevanje podatkov
https://www.arweave.org/

codeMonkey ::

JanBrezov je izjavil:

Poznam primer,


Lepa.


Ocitno zalozniki dobijo premalo sredstev za ustrezno infrastrukturo. :))

cvalsr ::

In glede na to, da gre danes za hiper inflacijo (fake) člankov, neke hude škode tudi ni, če gre to v digitalna nebesa. Tisti pomembni se bodo tako ali tako obdržali.

Tole bi moral napisati z debelimi črkami. Že na tem področju je internet postal nepregledno smetišče, kaj šele...

...komaj čakam, da bodo začele izginjati fotografije psov, lakiranih nohtov in sončnih zahodov, pa tiktoki, instadrek itd. Prihranki energije, diskovja, kablovja in ostalih virov bodo znatni.

Predlog: Ves balast omenjenega ranga naj se po dveh letih nepovratno briše, ČE ne doseže določene kvote pozitivnih ocen ali preseže kvoto negativnih!

codeMonkey ::

Butasti predlogi. Vcasih je nekaj dober clanek sele cez 20 let npr. Pa kaj je dober clanek danes, ko trgujejo s citati, tudi ne ves vec.

Zgodovina sprememb…

gruntfürmich ::

absolutno podpiram da ti 'znanstveni' članki izginjajo. zadnjih 10 let je poplava fejk, izmišljenih in napačnih člankov, ki ne služijo ničemur drugemu kot borba za točke. prispevek k človeštvu je izredno negativen.
praktično so avtorji celo veseli da njihovi članki izginjajo, da nobeden ne izve kakšen bulšit in laži so napisali v članek...
"Namreč, da gre ta družba počasi v norost in da je vse, kar mi gledamo,
visoko organizirana bebavost, do podrobnosti izdelana idiotija."
Psiholog HUBERT POŽARNIK, v Oni, o smiselnosti moderne družbe...

c3p0 ::

Itak, referenca pa ostane in podlaga za nov funding.

Seveda drugega logičnega razloga, da članki izginjajo, ni, storage je smešno poceni.

Okapi ::

En problem, ki se ga malokdo zaveda, je izginjanje zasebne dokumentacije in dopisovanja.

Ohranjenih je recimo 15.000 Darwinovih pisem (poslanih in prejetih) in prakticno vsi njegovi dnevniki, delovni zapiski...).
https://www.darwinproject.ac.uk/

Podobno velja za Einsteina.

https://einsteinpapers.press.princeton....

Za zgodovino znanosti so to zelo pomembne zadeve.

Kaj bo od e-dopisovanja sodobnih znanstvenikov ostalo čez sto let? Verjetno mnogi že sedaj včasih kaj pogrešajo, pismo, zapisek... ker nimajo dov9lj dobro urejenega digitalnega arhiva.

gruntfürmich ::

Okapi je izjavil:

Za zgodovino znanosti so to zelo pomembne zadeve.

za človeštvo kot tako pa ne, imho.
"Namreč, da gre ta družba počasi v norost in da je vse, kar mi gledamo,
visoko organizirana bebavost, do podrobnosti izdelana idiotija."
Psiholog HUBERT POŽARNIK, v Oni, o smiselnosti moderne družbe...

FireSnake ::

In stare zadeve se bodo lahko "prodale" kot nove.
Poglej in se nasmej: vicmaher.si

Okapi ::

gruntfürmich je izjavil:

Okapi je izjavil:

Za zgodovino znanosti so to zelo pomembne zadeve.

za človeštvo kot tako pa ne, imho.

Za "človeštvo kot tako" je pol znanosti nepomembne.


Vredno ogleda ...

TemaSporočilaOglediZadnje sporočilo
TemaSporočilaOglediZadnje sporočilo
»

Kam so šle prelomne raziskave

Oddelek: Novice / Znanost in tehnologija
264837 (2982) nekikr
»

ZDA razmišljajo o obveznem prostem dostopu do znanstvenih člankov

Oddelek: Novice / Znanost in tehnologija
4312407 (10281) jype
»

Nemški raziskovalci bodo danes izgubili dostop do znanstvenih člankov, težave tudi dr (strani: 1 2 )

Oddelek: Novice / Znanost in tehnologija
6124638 (21465) mojca
»

Sci-hub: znanstveni pirate bay pod žarometi

Oddelek: Novice / Znanost in tehnologija
4214924 (10037) Lonsarg
»

Blogerji morajo razkriti plačane recenzije (strani: 1 2 )

Oddelek: Novice / Ostale najave
547110 (5805) Isotropic

Več podobnih tem