» »

BBC med volitvami preizkusil robotske novinarje

BBC med volitvami preizkusil robotske novinarje

vir: Pxhere

vir: BBC
BBC - Strojno generiranje novinarskih tekstov je že dolgo med nami, le da doslej večinoma še ni bilo primerno za profesionalno rabo. BBC je med minulimi parlamentarnimi volitvami napravil največji tovrsten preizkus doslej, za vsako od nekaj manj kot 700 volilnih okrožij so objavili volilno poročilo, ki ga je spisal stroj. Večina jih je bila v angleškem jeziku, 40 pa v valižanščini. Vse tekste so pred objavo seveda preverili še človeški uredniki. Primer novice, seveda v angleškem jeziku, je videti takole:

"Florence Eshalomi has been elected MP for Vauxhall, meaning that the Labour Party holds the seat with a decreased majority. The new MP beat Liberal Democrat Sarah Lewis by 19,612 votes. This was fewer than Kate Hoey's 20,250-vote majority in the 2017 general election. Sarah Bool of the Conservative Party came third and the Green Party's Jacqueline Bond came fourth.

Voter turnout was down by 3.5 percentage points since the last general election. More than 56,000 people, 63.5% of those eligible to vote, went to polling stations across the area on Thursday, in the first December general election since 1923. Three of the six candidates, Jacqueline Bond (Green), Andrew McGuinness (The Brexit Party) and Salah Faissal (independent) lost their £500 deposits after failing to win 5% of the vote."

Strojno pisanje se danes že odlično obnese v podatkovno obarvanih tekstih, poleg poročil z volitev denimo še pri finančnih poročilih, pa rezultatih športnih tekem. Tokratni BBCjevi članki so imeli tudi stil pisanja prilagojen siceršnjemu stilu te medijske hiše, saj je možno predprogramirati določene besede oz. fraze, ki jih stroj nato med pisanjem izbere kot svoj odziv na določen podatek. Je pa taka umetna pamet za zdaj še nesposobna izdelati kako praktično analizo podatkov. Gre preprosto zgolj za povezavo danih podatkov v smiseln zapis, kar v novinarskem smislu ni ravno vrhunski izdelek. Prav zato s to tehnologijo pri BBCju ne nameravajo nadomestiti človeških novinarjev, pač pa zgolj razširiti svoje pokrivanje tem, ki jih prej zaradi kadrovskih omejitev niso mogli.

11 komentarjev

Jst ::

To bi bilo idealno RussiaGate, UkrainGate, ThanosTrumpGate (kjer se je Don Lemon skoraj zjokal - zaradi MEME SLIKE!!!). Tako noben ne bi verjel tem neumnostim...
Islam is not about "I'm right, you're wrong," but "I'm right, you're dead!"
-Wole Soyinka, Literature Nobelist
|-|-|-|-|Proton decay is a tax on existence.|-|-|-|-|

rabelj5 ::

bolj strokovno napisano kot novice na 24ur.com :))

Vazelin ::

Da ne bo na koncu AI najprej zamenjala pisune:))
I got 99 problems but 4 usd XTZ ain't one.

tikitoki ::

Res dosežek, k je algoritem moral sam cifre in imena vstaviti in par enostavnih izibr glede na rezultate.
Neke zares originalne vsebina pa tko ni bilo.

DexterBoy ::

Mene osebno je na primer vedno fasciniralo izrazoslovje Ježka; danes izraza "ako" sploh ne najdeš več.
Če bi nekdo danes pisal na njegov način, bi vedel, da za tem ne stoji koda, ampak pravi ljud.
Seveda bi se pa folk zgražal na socialnih omrežjih...
Ko ne gre več, ko se ustavi, RESET Vas spet v ritem spravi.
http://www.avtofil.si/

Matthai ::

tikitoki je izjavil:

Res dosežek, k je algoritem moral sam cifre in imena vstaviti in par enostavnih izibr glede na rezultate.
Neke zares originalne vsebina pa tko ni bilo.

To ni besedilo generirano na podlagi templata, pač pa strojno generirano besedilo na podlagi ML. Precejšnja razlika.
All those moments will be lost in time, like tears in rain...
Time to die.

Zgodovina sprememb…

  • spremenil: Matthai ()

tikitoki ::

Matthai je izjavil:

tikitoki je izjavil:

Res dosežek, k je algoritem moral sam cifre in imena vstaviti in par enostavnih izibr glede na rezultate.
Neke zares originalne vsebina pa tko ni bilo.

To ni besedilo generirano na podlagi templata, pač pa strojno generirano besedilo na podlagi ML. Precejšnja razlika.


Heh, originalni članek v ničemer ne podpira tvoje trditve. Pravzaprav podpira mojo trditev.
Sam zakaj bi prebral?

Matthai ::

Jaz sem ga tudi prebral, pa nimam občutka, da podpira tvojo trditev. V resnici nikjer natančno ne piše kaj točno sistem počenja. Ampak dejstvo je, da se besedil danes ne generira na podlagi templatov, to je povsem zgrešen pristop.

V bistvu sem celo našel, da uporabljajo nek Natural Language Generation system Salco (Semi-Automatic Local Content): https://bbcnewslabs.co.uk/news/2019/sal...

Tako da sklepam, da uporabljajo neko ML metodo.
All those moments will be lost in time, like tears in rain...
Time to die.

tikitoki ::

Očitno nisi prebral, ker zelo lepi piše. Čisto na koncu sicer.

Bi citiral, sam se na telefonu ne bom ukvarjal
.
Piše da so avtorji predvidevali vse možne izide in pripravili predloge.
Bolj jasno sploh niso mogli napisat.

Zgodovina sprememb…

  • spremenilo: tikitoki ()

Matthai ::

OK, potem se pa opravičujem.

Me pa čudi, da so ubrali tak pristop.
All those moments will be lost in time, like tears in rain...
Time to die.

Irbis ::

Matthai je izjavil:

Me pa čudi, da so ubrali tak pristop.

Meni se zdi, da je bila to najpreprostejša rešitev, ni neka velika znanost sprogramirati takih predlog in tudi ni tako strašno veliko dela, da se jih napiše. Nekaj ročnega dela seveda je, ampak tukaj jim ni šlo toliko za to, da bi zmanjšali količino dela, ampak predvsem za hitrost. In isto zadevo lahko ponovno uporabijo na naslednjih volitvah.
Glavna prednost pred strojnim učenjem se mi pa zdi predvidljivost, tukaj so (če izvzamemo kakšne hrošče pri programiranju in sestavljanju predlog, kar pa so lahko prej testirali) točno vedeli, da bodo rezultati v redu, zato so jih lahko takoj objavili brez ročnega preverjanja. Če bi uporabili ročno napisane članke od prejšnjih volitev, da bi se na njih strojno učili, bi se lahko kje hitro znašla kakšna omemba oseb, ki na tokratnih volitvah sploh niso sodelovale.


Vredno ogleda ...

TemaSporočilaOglediZadnje sporočilo
TemaSporočilaOglediZadnje sporočilo
»

CES: Sejemsko pohištvo 2013 (strani: 1 2 3 4 )

Oddelek: Novice / Znanost in tehnologija
18118707 (13789) Jst
»

Kapaciteta nasih politikov: Cvikl prepisoval iz Wikipedije (strani: 1 2 )

Oddelek: Loža
7225106 (23004) oldguy
»

Predsedniške volitve v ZDA 2004

Oddelek: Problemi človeštva
261960 (1416) Daedalus

Več podobnih tem