Za zdaj le za chicaške hotele
vir: PhysOrg.comNajprej so si pridobili bazo podatkov. Skupino ljudi so prosili, da napišejo lažne recenzije o 20 hotelih v Chicagu, ki so jih potem skupaj z resničnimi recenzijami analizirali. Ugotovili so, da se lažni sestavki jezikovno razlikujejo od resničnih. Imajo več daljših besed, višje razmerje med glagoli in samostalniki, pogosteje opisujejo naokoli (počitnice, poslovna pot ...) kakor konkretno (kopalnica, recepcija ...) itd. Z uporabo algoritma, ki je prepoznaval te lingvistične karakteristike, so uspeli določiti lažne recenzije z 89,9-odstotno natančnostjo. Če se je opravila lotil človek brez predhodne analize, pa ni bil uspešnejši od naključnega izbiranja.
Algoritem za zdaj deluje le za chicaške hotele, a v prihodnosti ga želijo posplošiti. In morebiti se kmalu primeri, da bomo imeli v Firefoxu vtičnik za filtriranje lažnih opisov.