Google Translate se je naučil spolskosti jezikov

Matej Huš

9. dec 2018 ob 11:58:03

Eden največjih problemov pri prevajanju besedil je različna količina informacij, ki je vgrajena v posamezne besede v različnih jezikih. Ko prevajamo iz jezika, kjer ima beseda ali stavek več informacij, kot jih potrebuje ciljni jezik, lahko informacijo preprosto izpustimo, če ni pomembna in običajna. Teže pa je v obratni smeri, ko ciljni jezik terja informacijo, ki je v izvirniku nimamo. Včasih jo poznamo iz konteksta, pri kratkih odlomkih, posameznih stavkih ali besedah, pa tega ne vemo.

Primerov je več. Medtem ko ima slovenščina splošen izraz za babico, v švedščini enotne besede ni. Obstaja babica po očetovi strani (farmor) in po materini (mormor). Prevajalec se mora odločiti, katero bo uporabil. Včasih informacijo zahteva že sam ustroj jezika - medtem ko angleški stavek I worked ne vsebuje nobene informacije o spolu, nevtralnega prevoda nimamo. Odločiti se moramo, ali je osebek moški ali ženski (Delal/a sem). Podobnih primerov je še ogromno, denimo precejkrat smešno zahvaljevanje nastopajočih v portugalščini, če ne vedo, da ima beseda hvala različne oblike, odvisno ali jo izreče moški ali ženska (obrigado ali obrigada).

Posebej problematično je to pri strojnem prevajanju, sploh če zamešamo moške in ženske oblike samostalnikov, ki poimenujejo ljudi. V angleščini je večina samostalnikov v tem pogledu nevtralna, še tiste zaznamovane pa v modernem času zamenjujejo nevtralne oblike (firefighter namesto fireman, chairperson namesto chairman). Nekateri jeziki pa imajo drugačen ustroj in imajo za večino besed žensko ustreznico. Google je sedaj svojemu orodju Translate izrecno dodal možnost, da prikaže obe ustreznici. Za zdaj so podprli prevode v francoščino, italijanščino, španščino, portugalščino in turščino, obljubljajo pa še ostale jezike.

To pomeni, da če v Google Translate vpišemo actor (igralec), bomo na primer v španščini dobili vzporedno oba prevoda: actriz (igralka) in actor (igralec). Podobno iz nurse (medicinska sestra) dobimo francoska infirmier in infirmière. Gre tudi v obratno smer: turški stavek o bir doktor nima nobene informacije o spolu, zato ga Google Translate prevede v obe možnosti: she is a doctor in he is a doctor.

Že minuli mesec pa je Google spremenil svoj Smart Compose tako, da ne predlaga več zaimkov, iz katerih je mogoče razbrati spol. Smart Compose je funkcija, ki nam predlaga besede in stavke za samodokončanje sporočil za hitrejše pisanje. V preteklosti je tako Smart Compose na stavek I am meeting an investor next week ponudil možnost Do you want to meet him?. Seveda nikjer ne piše, da so vsi vlagatelji moški, zato so nekateri takšno pomoč razumeli kot neprimerno. Odtlej Google ne predlaga več spolno specifičnih zaimkov.