Milijoni znanstvenih člankov niso ustrezno arhivirani in lahko kmalu izginejo

Matej Huš

9. mar 2024 ob 18:48:09

Osnovna valuta v znanstvenem establišmentu so znanstveni članki, ki podobno kot denar v ekonomiji opravljajo več funkcij. Po eni strani so poročila o raziskovalnem delu in zbirka znanja človeštva v sorazmerno surovi obliki, preden prečiščena pride v učbeniku, po drugi strani pa so zapis produktivnosti in kakovosti dela znanstvenikov in raziskovalcev. Razlogov, da jih želimo ohraniti za zanamce, je več, v svoji srži pa zanje velja podobno kot za knjige. A večina člankov dandanes že izide le v elektronskih revijah, zaradi česar so v večji nevarnosti, da nenadoma izginejo z obličja. To se že dogaja, ugotavljajo.

Raziskava, ki je bila objavljena v Journal of Librarianship and Scholarly Communication, je pokazala na hitro izgubljanje vsebin. Preverili so 7,4 milijona člankov, ki imajo unikatno številko DOI (digital object identifier). S tem enoličnim identifikatorjem bi moralo biti enostavno identificirati in najti članke ter ostale vsebine, ki dobijo DOI. To so tudi razna poglavja v knjigah, poročila itd. Vzorec v raziskavi so sestavili z naključnim izborom do tisoč del posameznega člana sistema Crossref - teh članov je okrog 20.000. Ugotovili so, da kar 28 odstotkov teh vsebin ni bilo možno več najti v spletnih arhivih - to je dva milijona vsebin. Preostanek je bil bodisi preveč nov (14 odstotkov), niso bili članki ali pa so bili članki, ki so bili v vsaj eni dostopni bazi (58 odstotkov).

Z drugimi besedami to pomeni, da je DOI sicer garancija, da lahko enolično identificiramo posamezno vsebino, ni pa to jamstvo za njeno dostopnost. Raziskava ne govori o plačljivih zidovih, temveč resničnem propadanju vsebin, kajti revije segajo od zelo uglednih do milo rečeno sumljivih ali celo garažnih, ki lahko nenadoma izginejo. Raziskava sicer ne trdi, da je dva milijona člankov že izginilo, temveč da niso primerno arhivirani in da lahko v prihodnosti res izginejo, če že niso doslej.