Računalniki prepoznavajo lažne recenzije
Matej Huš
26. jul 2011 ob 20:30:01
Eden izmed vedno večjih problemov na internetu so lažni recenzije ali pa samo mnenja o izdelkih in storitvah, ki jih pod pretvezo kupca pišejo prodajalci sami v upanju povečati zanimanje in prodajo. Dobroverni kupci imajo pri prepoznavanju teh lažnih kosov pisarije precej problemov, ker ljudje po naravi pisani besedi verjamejo. Zato raziskovalci na Univerzi Cornell razvijajo algoritem, ki prepozna lažne recenzije (imenujejo se opinion spam in ne gre za nov izraz).
Najprej so si pridobili bazo podatkov. Skupino ljudi so prosili, da napišejo lažne recenzije o 20 hotelih v Chicagu, ki so jih potem skupaj z resničnimi recenzijami analizirali. Ugotovili so, da se lažni sestavki jezikovno razlikujejo od resničnih. Imajo več daljših besed, višje razmerje med glagoli in samostalniki, pogosteje opisujejo naokoli (počitnice, poslovna pot ...) kakor konkretno (kopalnica, recepcija ...) itd. Z uporabo algoritma, ki je prepoznaval te lingvistične karakteristike, so uspeli določiti lažne recenzije z 89,9-odstotno natančnostjo. Če se je opravila lotil človek brez predhodne analize, pa ni bil uspešnejši od naključnega izbiranja.
Algoritem za zdaj deluje le za chicaške hotele, a v prihodnosti ga želijo posplošiti. In morebiti se kmalu primeri, da bomo imeli v Firefoxu vtičnik za filtriranje lažnih opisov.