»

Število neobstoječih citatov v biomedicinskih znanstvenih člankih poletelo

Slo-Tech - Maxim Topaz in sodelavci s Columbie so analizirali 2,5 milijona znanstvenih člankov s področja biomedicinskih ved in ugotovili, da se je v minulih treh letih število referenc, ki se nanašajo na neobstoječe članke, več kot podeseterilo. To sovpada s širokim razmahom orodij umetne inteligence, ki se uporabljajo tudi za urejanje besedila in druge naloge v raziskovanju. Rezultate so objavili v The Lancetu.

Tomaz se je raziskave lotil, ko se je tudi njemu primerila takšna nečednost. Ukvarja se namreč z raziskavami umetne inteligence in besedila popravi tudi z velikimi jezikovnimi modeli. A presenetilo ga je, ko mu je urednik sporočil, da je v enem izmed njegovih rokopisov težava, saj ima neobstoječo referenco. Ker se mu je to zgodilo zaradi nepazljivosti, kar ga seveda ne odvezuje odgovornosti, se je odločil raziskati, koliko literature ima iste težave.

Med 2,5 milijona člankov in 97 milijoni referenc, ki jih indeksira repozitorij PubMed Central, je odkril 4000 neobstoječih referenc....

4 komentarji

Odvetnik kaznovan z 10.000 dolarji, ker je zavajal s ChatGPT

Slo-Tech - Kalifornijsko sodišče je odločilo, da mora tamkajšnji odvetnik Amir Mostafavi plačati rekordnih 10.000 dolarjev visoko globo, ker je julija 2023 sodišču predložil pritožbo, ki jo je napisal z umetno inteligenco. V njej je bilo kar 21 izmed 23 navedb o prejšnjh primerih neobstoječih. Izmišljene reference je predlagal ChatGPT, ki je tedaj - čeprav je bil OpenAI nekaj mesecev pred tem objavil, da je na simulaciji opravil pravosodni izpit - haluciniral še izdatneje od današnjih verzij. Mostafavi izdelka ni niti prebral, preden ga je predložil sodišču. Sam je dejal, da je ChatGPT uporabil za izboljšavo jezika in vsebine, a da ni vedel, da se lahko v novem dokumentu znajdejo neresnične navedbe.

Rekordno visoka globa ima zato predvsem vzgojni namen. Sodišče je dejalo, da Mostafavi tratil čas sodišča in davkoplačevalski denar. Kršil je pravila, citiral je neobstoječe primere in s tem vložil neutemeljeno in neresno (frivolous) pritožbo. Prizivno sodišče je ob tem dejalo, da odvetniki...

17 komentarjev

Osmina znanstvenih člankov ima prstne odtise umetne inteligence

Slo-Tech - Veliki jezikovni modeli, ki so se pojavili v zadnjih letih, so po eni strani močno napredovali in ustvarjajo skorajda človeška besedila, po drugi strani pa so vplivali na besedišče, saj je pogostost uporabe posameznih besed drugačna kot pri naravnih govorcih. To je ena izmed značilnosti, ki jih moremo uporabiti za analizo njihove razširjenosti. Prav to so storili raziskovalci z Univerze Northwestern v Illinoisu in Univerze v Tübingenu v Nemčiji, ko so analizirali 15 milijonov povzetkov (abstract) biomedicinskih znanstvenih člankov iz baze PubMed, ki so nastali v letih 2010-2024. Lani je že 13,5 odstotka vsebin kazalo, da so pri njihovem nastanku avtorju v večji ali manjši meri uporabili velike jezikovne modele (LLM). V nekaterih vedah je ta delež dosegel 40 odstotkov. O raziskavi poročajo v reviji Science Advances.

Članek so ironično naslovili Delving into LLM-assisted writing in biomedical publications through excess vocabulary, saj je prav beseda delve z razmahom LLM-jev...

17 komentarjev

Knjiga o uporabi strojnega učenje vsebuje lažne citate

Slo-Tech - Priznani založnik znanstvene literature Springer Nature je aprila izdal knjigo Mastering Machine Learning: From Basics to Advanced, ki bi očitno lahko služila kot zgled, kako umetne inteligence ali strojnega učenja ne smemo uporabljati. Številne reference v knjigi so neobstoječe ali močno napačne, so ugotovili na Retraction Watch. V knjigi ni navedeno, da bi avtorji uporabljali umetno inteligenco, a sumljivi citati namigujejo na to. Felicitas Behrendt iz Springer Nature je dejala, da primer preiskujejo.

Da je z referencami nekaj narobe, je prvi opazil - paradoksalno - stroj. Google Scholar je avtorje del, ki jih knjiga citira, obvestil o novem citatu. A ti so hitro ugotovili, da so citirana njihova neobstoječe dela, o čemer so obvestili Retraction Watch. Tam so analizirali reference in ugotovili, da jih precej sploh ne obstaja. Druge pa so citirane napačno, denimo rokopisi z arXiv, ki na koncu niso bili objavljeni, so navedeni kot objave v revijah, denimo IEEE Signal Processing...

7 komentarjev

Wiley v letu dni umaknil 11.300 člankov, sedaj zapira 19 revij

Slo-Tech - Uveljavljeni založnik znanstvene periodike Wiley je včeraj sporočil, da bodo ukinili 19 znanstvenih revij, ker so bile prepredene z lažnimi članki. V minulih dveh letih je sicer Wiley, ki ima 217-letno tradicijo, umaknil 11.300 člankov, ki so bili tako ali drugače neverodostojni. Umik članka sam po sebi ni nič tragičnega, saj se napake dogajajo, spoznanja pa pogosto revidirajo, a obseg kaže na sistemski problem. Število umikov se povečuje tudi pri drugih založnikih. IOP Publishing, ki se specializira zgolj na fiziko, je leta 2022 umaknil 900 lažnih člankov.

Eden izmed razlogov za epidemijo umikov so farme člankov (paper mills), ki raziskovalcem proti plačilu omogočijo soavtorstvo ničvrednih člankov, ki jih nato objavijo (pod)povprečnih revijah. Osnovni razlog je velikanski pritisk na raziskovalce, ki morajo publicirati čedalje več in hitreje, da ostanejo konkurenčni pri pridobivanju raziskovalnih projektov ali pogosto zgolj da obdržijo zaposlitev. Dodatna vzpodbuda je hibridni...

19 komentarjev

Kaj bi lahko šlo narobe, če odvetniki uporabljajo ChatGPT

Slo-Tech - Pred štirimi leti je Roberto Mata z letalom družbe Avianca potoval iz El Salvadorja v New York. Med strežbo ga je eden izmed članov posadke z vozičkom zadel v koleno, kar je po Matovih besedah povzročilo poškodbo, zato je prevoznika tožil. Avianca je v odzivu predlagala, da sodišče primer zavrže, ker je vmes že zastaral. Odvetniki tožnika so odgovorili z deset strani dolgim pojasnilom, v katerem so navajali več sodnih primerov, zakaj sodišče tega ne bi smelo storiti. Z argumentacijo je bil samo en problem: v njej so navajali dvanajst primerov, ki jih ni mogel najti nihče.

Odvetniki Aviance so namreč pri analizi predloga tožnika naleteli na primer Varghese v China South Airlines Ltd, 925 F.3d 1339 (11th Cir. 2019), a pri iskanju niso našli nič podobnega. Iskanje po priimku, številki zadeve in drugih primerih je bilo neuspešno. Podrobna analiza je pokazala, da se tožnik sklicuje še na druge neobstoječe primere. Sodišče je odvetnikom nemudoma naložilo, da morajo pojasniti, kaj se...

41 komentarjev