Odkrili 120 lažnih znanstvenih člankov

Matej Huš

26. feb 2014 ob 10:35:15

Na teh straneh smo že večkrat pisali o spornem ravnanju, ki ga zasledimo v akademskih vodah in sega od še najbolj nedolžnega nepotrebnega citiranja (da bi si zvišali možnost objave članka) do hudih finančnih prevar pa vse do absurdnih objav nesmiselnih člankov. Cyril Labbé z Univerze Joseph Fourier v Grenoblu je sestavil računalniški algoritem za odkrivanje nesmiselnih računalniško generiranih člankov, ga pognal skozi povzetke s konferenc (proceedings) iz let 2008-2013 in našel 120 popolnoma nesmiselnih člankov. Ti niso bili objavljeni v kakšnih obskurnih revijah, ampak večinoma pod okriljem IEEE, manjši del pa v Springerjevih publikacijah.

Kot je znano, sestaviti nesmiseln znanstveni članek ni posebno težko, še zlasti od leta 2005, ko so na MIT-u pripravili SCIgen. Gre za orodje, ki samo sestavi nekaj besedila, ki zveni sila učeno in strokovno, v resnici pa ne pomeni nič. In tako dobimo članek, ki nima ne repa ne glave - niti vsebine. Eksperimenti so pokazali, da je z malo truda mogoče tak članek objaviti. To seveda ni bil prvi tovrsten primer, saj je že leta 1996 Alan Sokal objavil članek, ki ni imel nobene vsebine, samo da bi pokazal, da je to mogoče.

Dokler gre za akademske poizkuse, ki služijo odkrivanju pomanjkljivosti v postopku recenzije, je vse lepo in prav. A problem nastopi, ko se tovrstna telovadba s članki zlorablja za napihovanje lastne vrednosti. Labbé je aprila 2010 pokazal, da je to mogoče, ko si je izmislil Ikeja Antkareja. Ta je z nekaj lažnimi članki in citati hitro postal 21. najbolj citirani znanstvenik na svetu. Niso neznani niti redki primeri, ko so znanstveniki objavljali neresnice, da so si (za kratek čas) zgradili zvezdno pot do akademske kariere. Prevare so lahko zelo kompleksne, kot je bilo manipuliranje z vzorci pri raziskavah HIV, ali pa zgolj pišejo članek iz neobstoječih ali propadlih eksperimentov (recimo Schönov škandal). Še en eksperiment je napravil Bohannon, ki je uspel isto prevaro objaviti v več kot sto revijah. Že pred dvema letoma smo opozarjali, da delež umaknjenih člankov in prevar narašča.

Problema z neresničnimi članka sta torej dva. Eno so članki, ki so nesmiselni že sami po sebi in bi jih moral temeljit recenzentski pregled (peer review) odkriti, drugi pa so članki, ki jih napišejo ljudje s pokvarjenimi nameni. Te druge in pa lažnive revije ali konference - da, tudi to obstaja - bomo to pot pustili ob strani. Povejmo le, da se preverjanje rezultatov v znanosti že dolgo ne dogaja več, razen za najbolj revolucionarna odkritja (recimo arzenove bakterije so temeljito prečesali) ali ko kdo slučajno počne kaj podobnega. Ni pa ponavljanje eksperimenta del recenzije oziroma peer reviewa, ki je zgolj papirnat. Kdor uspe dobiti neko stalno pozicijo in dela na področju, ki ni preveč zanimivo niti široko, lahko prav lahko objavlja stvari, pa jih nihče ne bo nikoli preveril. Žal je to neizogibna posledica hiperprodukcije vsega.

Nazaj k nesmiselnim člankom. Da se ti objavijo, pa ni opravičila. Uredniki ne bi smeli v objavo sprejeti članka, ki ga ni preveril vsaj en, najraje pa več poznanih strokovnjakov s področja, ne glede na njegovo nišnost. Beseda poznanih je poudarjena zato, ker so bili tudi primeri, ko so si avtorji sami izmišljevali neobstoječe recenzente, od katerih elektronski naslov so imeli sami, pa so si potem pisali pozitivne recenzije. Ni nujno, da so plačljive revije kaj boljše od brezplačnih (kjer pa morajo avtorji za objavo plačati, kar je za slovensko znanost že finančni problem), saj so bile v zadnjem primeru vse revije plačljive. Še več, v Springerju zagotavljajo, da so šli vsi objavljeni članki skozi pregled, zato res ni jasno, kako se je lahko zgodila takšna malomarnost. V IEEE molčijo.

Obe ustanovi sta že umaknili vse članke, ki so bili označeni kot nesmiselni. Univerza v Grenoblu je orodje za odkrivanje teh čudnih člankov - še plagiati jim ne moremo reči - postavila na internet, kjer lahko vsakdo preveri, ali je članek nastal s SCIgen. Kdor želi, se lahko pozabava z igro snarxiv, kjer lahko ugotavlja, ali po naslovu loči med računalniško generiranim in resničnim člankom. Za nestrokovnjake na področju to sploh ni tako enostavno.

Prvobitni razlog za številne prevare v znanosti (čeprav boste ne glede na vse vedno in povsod imeli delež pokvarjenih posameznikov) pa ostaja gonja za objavami - publish or perish, ki jo pooseblja faktor vpliva. A to je že zgodba za kdaj drugič.