Analiza pol milijarde sporočil s Twitterja razkriva dinamiko človeškega počutja
Matej Huš
1. okt 2011 ob 11:09:01
Pomembna uporabna vrednost modernih socialnih omrežij se kaže v sociologiji, psihologiji in medicini, saj omogočajo analize vedenja in čustvovanja ljudi, ki so se še pred časom zdele nemogoče. Z njimi smo namreč dobili ogromne količine podatkov o ljudeh, ki jih ti napišejo sami, namenijo v branje prijateljem in so povrhu še vsakokrat opremljena s točnim časom nastanka zapisa. Scott A. Golder in Michael W. Macy z Univerze Cornell sta uporabila 509 milijonov sporočil na Twitterju, ki jih je 2,4 milijona uporabnikov iz 84 držav po vsem svetu napisalo v zadnjih v dveh letih. V članku, ki je objavljen v reviji Science, poročata o svojih odkritjih.
Gre za prvo raziskavo o sporočilih na Twitterju v tako velikem obsegu, da omogoča sklepanje na vzorce, ki presegajo kulturne okvire posamezne države. Avtorja sta ugotovila, da je dinamika človeškega počutja bolj ali manj stalna v vseh državah sveta, četudi so si tako različne, kot so ZDA in Združeni arabski emirati. Načeloma se ljudje zbudijo najboljše volje, nato pa se njihovo razpoloženje po malem slabša skozi ves dan. Proti večeru se sicer nekoliko popravi, a običajno ne doseže jutranje ravni. Med vikendi, ki so dela prosti (recimo v ZAE je to petek in sobota, v ZDA pa sobota in nedelja), se dogajanje na Twitterju prične dve uri pozneje, ker ljudje spijo dlje, in je bistveno bolj vedro - ljudje so boljše volje. Ti vzorci so podobni povsod po svetu, ugotavljata.
Raziskovalca sta sporočila zbrala za uporabo API-jev za Twitter. Imela sta gručo šestih računalnikov, ki je podatke v formatu XML iz Twitterja spremenila v navadne tekstovne datoteke. Podatke so nato prenesli na gručo 55 računalnikov Hadoop na Cornellu, kjer so izvedli obdelavo oziroma podatkovno rudarjenje z opremo LIWC (Linguistic Inquiry and Word Count). Nekatere besede, na primer fantastično ali čudovito, so povezali s pozitivnim razpoloženjem, druge, na primer strah ali žal, pa z negativnim.
Golder pojasnjuje, da taka analiza daje bolj natančne podatke kot psihološki eksperiment, saj so opazovali ljudi v naravnem okolju, ali izpolnjevanje anket in vprašalnikov, saj se ni bilo treba zanašati na zanesljivost človeškega spomina.