Strojno pisanje besedil se že širi po spletnih medijih

Jurij Kristan

30. jan 2023 ob 07:27:41

Pri BuzzFeedu so objavili, da razvijajo algoritem na osnovi GPTja, ki bo generiral nekatere prispevke. Najava prihaja neposredno po januarski aferi, v kateri so se pri CNETu opekli s tihim uvajanjem lastnega algoritma za pisanje novic.

Sredi januarja so pri Futurismu po namigih nekaterih analitikov odkrili, da se je za oddelkom Money Staff, ki je za medij CNET pisal nekatere članke s finančnim svetovanjem, v resnici skrival - generativni algoritem za besedila, kakršen je na primer tudi razvpiti GPT, družbe OpenAI. "Podpis" strojnega avtorja je bil zelo prikrit: na strani samih člankov ga ni bilo in bralec je do podatka, da je bilo besedilo bržda ustvarjeno samodejno, prišel šele, če je odjadral do podstrani o avtorju. Pa še to verjetno zgolj od januarja dalje, kajti nadaljnje poizvedovanje je pokazalo, da je medijska hiša to počela že več mesecev - vsaj od novembra - in to namenoma prikrivala, ker je bil projekt še v preizkusni fazi. Pri Vergu so nato izbrskali, da je vzrok za takšno početje bržkone v prvi vrsti izigravanje Googlovega iskalnega algoritma, saj je generator gradil (tudi) na že dlje časa izrabljanem znanju o tem, katere besede Googlovi pajkci najraje zagrabijo in se tako članki dokopljejo do višjega števila bralcev.

Da prikrivanje avtorstva ni največji problem, je postalo jasno že nekaj dni kasneje, ko se je izkazalo, da ima množica teh člankov napake in po vsej verjetnosti tudi neposredno prepisuje od drugod. To je načelujoče pri CNETu naposled prisililo, da so s prakso začasno prenehali in izvedli revizijo vseh člankov. Ta je prejšnji teden pokazala, da je imelo 41 od 77 strojno generiranih člankov napake, pri nekaterih pa so morali spremeniti tudi dele besedila, ki so preveč spominjali na druge vodiče na spletu, predvsem Forbesove. Kljub temu pri družbi Red Ventures, trenutnih lastnikih CNETa, zagotavljajo, da je to zgolj začasni neuspeh in da še naprej verjamejo v prihodnost strojno generiranih besedil, zato so očitno pred nami časi, ko bomo morali pred branjem obvezno preveriti, ali je tekst sploh napisala človeška roka. Raba algoritmov sicer ni nova reč, saj na primer Associated Press in Washington Post že več let strojno generirata razne finančne tabele, toda razlika med njimi in besedili na CNETu je očitna.

V tej luči je zadnje dni dosti prahu dvignila najava BuzzFeeda, da bodo s tovrstnim algoritmom - na bazi GPT 3.5 - pričeli eksperimentirati tudi sami. Za štart še ne bo šlo za prave novice ali reportaže, temveč kratkočasne kvize, na podlagi katerih nam bo stroj denimo zgeneriral zgodbico. Toda borzni tečaj družbe je takoj po novici že skočil v nebo in očitno je klima med vlagatelji glede tega zelo optimistična, kar verjetno jezdi na valovih bliskovitega uspeha pogovornega algoritma ChatGPT. Dvomljivci po drugi plati opozarjajo, da norija že spominja na tisto okoli NFTjev, metaverzuma in blockchaina. Vsekakor nas glede tega čaka zelo živahno leto.