Microsoft razvil robota, ki vam sega v besedo

Matej Huš

6. apr 2018 ob 10:30:59

Roboti za pogovore (chatbot) so danes že zelo dodelani in se znajo odzivati na smiseln način, a le pri pisanju. Pri govorjenju je drugače. Glavni problem ni razpoznavanje govora ali njegova sinteza, temveč zakasnitve. Trenutno je pogovor namreč bolj podoben komunikaciji prek govorne postaje, kjer vsak sogovornik odrecitira svoje besedilo, nato pa počaka, da drugi besedilo sliši, premelje in sestavi odgovor. V resnici pa po telefonu ne govorimo tako. Ljudje se prekinjamo, segamo v besedo, včasih si dokončujemo stavke itd. Pogovor je interaktiven, obojestranski in sočasen. Tega se morajo naučiti tudi računalniki, in Microsoft trdi, da mu je to uspelo.

Microsoftov zelo popularen chatbot na Kitajskem se imenuje XiaoIce in ima 200 milijonov uporabnikov, a ima točno ta, zgoraj opisani problem. Vodja projekta Li Zhou pojasnjuje, da so vanj nedavno uvedli novosti, ki njegovo komunikacijo približujejo naravni. Spremembo je opisal v telekomunikacijskem žargonu - XiaoIce zdaj obvlada full duplex. XiaoIce odslej že sproti predvideva, kaj bo oseba rekla, tako da se lahko pravočasno odzove, kot bi to storil človek - včasih že vmes. Ying Wang, ki v Microsoftu nadzoruje Zo, ki je ameriški chatbot, pravi, da je to osnovna umetnost pogovarjanja, ki jo ljudje uporabljamo vsakodnevno. Microsoft bo namreč novost iz chatbota XiaoIce uvedel tudi v Zo in ostale jezike.

Poleg tega se je XiaoIce naučil še kup drugih trikov, denimo prekiniti pogovor za kakšno vmesno opravilo, potem pa se vrniti nazaj k rdeči niti. Podobno počno tudi ljudje, ko se v dolgi zgodbi ustavijo z medklicem in kratko stranpotjo, potem pa nadaljujejo glavno zgodbo. XiaoIce pač ni Cortana, ki je namenjena kratki interakciji, kjer od nje želimo nek podatek ali opravilo, temveč daljši komunikaciji.