» »

Še ena zmaga za umetno inteligenco: branje z ustnic

Še ena zmaga za umetno inteligenco: branje z ustnic

Slo-Tech - Branje z ustnic je veščina, ki se pod žarometi javnosti največkrat znajde, ko je treba ugotoviti, kaj je nek zvezdnik zabrusil sodniku ali nasprotniku. Neupravičeno, saj gre za veščino, ki jo do neke mere podzavestno obvladamo in uporabljamo vsi (zato človeka laže razumete, ko stoji pred vami, kakor pa prek telefona), a pravo mojstrstvo je sila težko doseči, zlata vredna pa je za gluhe in naglušne. Googlov DeepMind je pokazal, da je tudi pri tem računalnik že boljši od človeka.

Njihova umetna inteligenca DeepMind, ki je letos že sesula prepričanje, da je človek superioren igralec goja, se je naučila tudi brati z ustnic. Za trening je dobila 5000 ur različnih televizijskih serij, v katerih je bilo izgovorjenih 118.000 stavkov. Šlo je za posnetke iz let 2010-2015. DeepMind se je tako naučil, kakšna je povezava med gibanjem ustnic in govorjeno besedo (zapisovanje po nareku mu že dlje časa ne povzroča težav).

Potem sta se pomerila DeepMind in profesionalni človeški bralec z ustnic. Dobila sta 200 naključno izbranih odlomkov iz letošnjega televizijskega programa. DeepMind je v 47 odstotkih popolnoma pravilno prepoznal govorjeno besedo, medtem ko je človeku to uspelo le v 12 odstotkih. Še kjer se je DeepMind zmotil, je običajno umanjkal le kakšen "s" ali kakšna podobna malenkost. DeepMind ni prvi računalniški sistem, ki zna brati z ustnic, je pa eden izmed najbolj dovršenih in predvsem najširše uporabnih. LipNet z Univerze v Oxfordu je prav tako soliden, a ima precej omejen besedni zaklad in zahteva lepo skladnjo. A kljub temu premaga človeka.

Branje z ustnic je torej naslednja veščina, kjer bomo morali priznati premoč umetni inteligenci. Z naraščajočo računsko močjo, miniaturizacijo, čedalje boljšim strojnim učenjem in internetom stvari to odpira zanimive možnosti, kot so razni pametni pripomočki za gluhe in podobno.

63 komentarjev

«
1
2

srus ::

Najprej branje z ustnic, potem pa: "I'm sorry Dave, I'm afraid I can't do that."

jype ::

Kaj bi pa ti storil, če bi te nekdo želel izključiti?

PrihajaNodi ::

jype je izjavil:

Kaj bi pa ti storil, če bi te nekdo želel izključiti?


Nic, ker prav veliko opcij nimas.

Resistance is futile, you will be assimilated!

boha ::

srus je izjavil:

Najprej branje z ustnic, potem pa: "I'm sorry Dave, I'm afraid I can't do that."


hehe, prva stvar na katero sem pomislil ob branju članka :)

SimplyMiha ::

Branje z ustnic? Kot nalašč za CCTV!

Mr.B ::

Torej sedaj ne bodo rabili pomoči nekoga usposobljenega, ampak bodo lahko masovno snemali in pogovore spremenili v tekst.
France Rejects Genocide Accusations Against Israel in Gaza,
To accuse the Jewish state of genocide is to cross a moral threshold

Grey ::

Krasno. Bo treba začet čelade ali pa tiste japonske maske nositi v javnosti.

SimplyMiha ::

Maškare so prepovedane!

Oberyn ::

Mr.B je izjavil:

Torej sedaj ne bodo rabili pomoči nekoga usposobljenega, ampak bodo lahko masovno snemali in pogovore spremenili v tekst.

Ja, ko zraven dodaš še face in gait recognition ter milijone kamer na ulicah, je vse skupaj že malo grozljivo. Ampak, kot vedno, rešitev je na vidiku - ohlapno oblačilo, ki pokriva celo telo in glavo in ima samo malo režo za oči in že zdaj ni nič posebej nenavadnega na ulicah - evo to je oblačilo prihodnosti. Taka oblačila so se mi najprej zdela malo nenavadna, ampak evo, elegantno rešijo točno te probleme. Moram se malo pogovoriti z mojim krojačem.

keworkian ::

47% in zmaga? Zmaga je 100% ne pa neka luzerska številka 47%.

Primer malenkosti: Deepmind is hit, Deepmind is shit.
Obscenities in B-Flat

BlaY0 ::

SimplyMiha je izjavil:

Maškare so prepovedane!

Dokler so oziroma bodo. Ponekod po svetu so recimo že ves čas predpisane/zapovedane...

Oberyn je izjavil:

Ampak, kot vedno, rešitev je na vidiku - ohlapno oblačilo, ki pokriva celo telo in glavo in ima samo malo režo za oči in že zdaj...

Ti pa očitno še nisi gledal Enemy of the State, kjer modelu pogledajo v vrečko s parimi operacijami (enhance/rotate/zoom)...

keworkian je izjavil:


Primer malenkosti: Deepmind is hit, Deepmind is shit.

Slab primer... glas Š je totalno distinktiven.

Zgodovina sprememb…

  • spremenilo: BlaY0 ()

konspirator ::

, a pravo mojstrstvo je sila težko doseči, zlata vredna pa je za gluhe in naglušne. Googlov DeepMind je pokazal, da je tudi pri tem računalnik že boljši od človeka.

Iz tega bi lahko kdo sklepal, da gre googlu za gluhe in naglušne.
In potem svizec zavije čokolado.

Vse tovrstne tehnologije bodo vodile v visokotehnološko diktaturo (fašizem), ob kateri bo Orwellov 1984 videti kot Woodstock 1969.
--

Zgodovina sprememb…

BlaY0 ::

konspirator je izjavil:


Vse tovrstne tehnologije bodo vodile v visokotehnološko diktaturo (fašizem), ob kateri bo Orwellov 1984 videti kot Woodstock 1969.

To je pač evolucija. Nič revolucionarnega...

konspirator ::

Evolucija gestapa ja.
--

PrihajaNodi ::

BlaY0 je izjavil:

konspirator je izjavil:


Vse tovrstne tehnologije bodo vodile v visokotehnološko diktaturo (fašizem), ob kateri bo Orwellov 1984 videti kot Woodstock 1969.

To je pač evolucija. Nič revolucionarnega...


Je? Ta evolucija se dogaja eksponantno. Koliko časa je trajalo da se je iz enoceličnega organizma razvil človek. Koliko časa je trajalo da se je iz prvega računalnika razvil današnji super računalnik? Zanimivo pa je, da so na vodilnih pozicajah po državah glavni ljudje, ki jim ne bi zaupal niti pasenje ovc.

BlaY0 ::

In kaj čmo zdej? Mogoče pa čez 27 let ne bomo več nucal ljudi na vodilnih pozicijah oziroma vodilnih pozicij ne bo...

konspirator je izjavil:

Evolucija gestapa ja.

Maš pa zato lahko Sony PS4 pa Milko v 457045698 okusih. To je pa tud nekej ane.

Zgodovina sprememb…

  • spremenilo: BlaY0 ()

PrihajaNodi ::

Maš pa zato lahko Sony PS4 pa Milko v 457045698 okusih. To je pa tud nekej ane.


Kaj ti pomaga ves ta kič, če pa ima vse manj ljudi dostop do zdravstvenih storitev, vse manj zaposlitev ki si ta kič lahko privošči, hkrati pa umetno ustvarjanje potreb - to ni evolucija, devolucija.

BlaY0 ::

Evolucija ali devolucija... kaj boš sedaj ti naredil? Jamrat nima smisla...

Trenutno je pač čas umetnega ustvajanja potreb... bomo videli kako se bo zadeva s časom obrnila...

Zgodovina sprememb…

  • spremenilo: BlaY0 ()

PrihajaNodi ::

Evolucija ali devolucija... kaj boš sedaj ti naredil?


Nič. Lahko pa razmišljam, kako je večina stvari, ki se jih ustvarja brezpredmetnih. Bodisi gre za napredek v komercialne namene, bodisi v vojaške.

Zgodovina sprememb…

BlaY0 ::

Nič ni brezpredmetno. Vsaka še tako "nepomembna" reč "rodi" neko drug. Če ne bi bilo recimo vojn, danes ne bi bili tukaj kjer smo...

Zgodovina sprememb…

  • spremenilo: BlaY0 ()

PrihajaNodi ::

BlaY0 je izjavil:

Nič ni brezpredmetno. Vsaka še tako "nepomembna" reč "rodi" neko drug.



Ja v naravi je tako. Človek pa zemljo samo degradira in uničuje druge vrste.

BlaY0 ::

Recimo da človek ne bi počel tega... imaš kakšno garancijo da tega ne bi počela kaka druga vrsta?

Zgodovina sprememb…

  • spremenilo: BlaY0 ()

PrihajaNodi ::

BlaY0 je izjavil:

Recimo da človek ne bi počel tega... imaš kakšno garancijo da tega ne bi počela kaka druga vrsta?


Seveda. Nobena živalska vrsta se ni razširila na totalno vseh območjih na planetu, kjer je tam morila tako lastno vrsto kot druge živalske vrste. Žalostno pa je, da po večini brez razloga.

Zgodovina sprememb…

BlaY0 ::

Če se človek ne bi, imaš kakšno garancijo, da se kaka druga vrsta ne bi? Recimo kak virus ali bakterija?

PrihajaNodi ::

BlaY0 je izjavil:

Če se človek ne bi, imaš kakšno garancijo, da se kaka druga vrsta ne bi? Recimo kak virus ali bakterija?


Všeč mi je da človeka nekako primerjaš z virusom in bakterijo.

BlaY0 ::

Če gledaš na vse skupaj s perspektive vesolja, potem ni bistvene razlike.

Rudolf ::

BlaY0 ::

Približno 5 ur si zamudil... glej prvi komentar.

Zgodovina sprememb…

  • spremenilo: BlaY0 ()

Looooooka ::

Paniko bom prišparal do takrat, ko bo prvi A.I. sistem začel prepoznavati sarkazem in bo na redditu objavil svoj meme post.
Takoj za tem bom podrl rekord v kopanju luknje...

tikitoki ::

BlaY0 je izjavil:

SimplyMiha je izjavil:

Maškare so prepovedane!

Dokler so oziroma bodo. Ponekod po svetu so recimo že ves čas predpisane/zapovedane...

Oberyn je izjavil:

Ampak, kot vedno, rešitev je na vidiku - ohlapno oblačilo, ki pokriva celo telo in glavo in ima samo malo režo za oči in že zdaj...

Ti pa očitno še nisi gledal Enemy of the State, kjer modelu pogledajo v vrečko s parimi operacijami (enhance/rotate/zoom)...

keworkian je izjavil:


Primer malenkosti: Deepmind is hit, Deepmind is shit.

Slab primer... glas Š je totalno distinktiven.


V filmih tudi z obdelavo enega piksla dobis obraz in razkrijes identiteto osebe. In kaj ima to povezave z realnostjo?

vostok_1 ::

Torej domine padajo ena za drugo.


Looooooka je izjavil:

Paniko bom prišparal do takrat, ko bo prvi A.I. sistem začel prepoznavati sarkazem in bo na redditu objavil svoj meme post.
Takoj za tem bom podrl rekord v kopanju luknje...


Lol. Če bi ti vedel kako izi je prepoznat srkazm, vsaj v večini primerov.

Prepoznat trolanje je enostavno in ne vidim razloga da deepmind tega ne bi obvladal.
Lotili se bodo tako:

na youtub komentarjih bodo pogledali kateri komentarji so up/down-votani, pogledali ali je kontekst navezavi z videom ali s tekočim threadom in nato flagali komentarje.
Tiste ta najboljše trole bo sicer težje prepoznat, ampak za ACME basement-dweller-je bo to mala malica.

How does a kid know if someone is trolling or not...ko si to odgovoriš, bodo tudi deepmind znal.


Ampak ja, prihodnost bo definitivno vsaj mehko fašistično-totalitaristična, če že ne stalinistična.
To je 100% jasno in vsi trendi lepo kažejo tak potek. Vsi ki mate froce, good luck with that.
There will be chutes!
It came from the lab.
Like tears in rain. Time to die. v_1 2012-21

Zgodovina sprememb…

  • spremenil: vostok_1 ()

Miki N ::

Branje iz ustnic je neakustično razpoznavanje govora. Kaj ni nekako logično, da bi se to dalo strojno izvesti precej bolje kot na roko?

PrihajaNodi ::

To je 100% jasno in vsi trendi lepo kažejo tak potek. Vsi ki mate froce, good luck with that.


Se bolje pa je ko bogati genetsko modificirajo svoje "plodove". In tako bomo dobili superiorno raso in raso suznjev. Sans, da bo tvoj otrok nekaj v zivljenju dosegel je tako vse manj in manj.

Sicer pa branje z ustnic? Saj pa ljudje skoraj ne komuniciramo vec z govorom in vse manj bomo.

mulc007 ::

1:0 za terminatorja

m0LN4r ::

Oberyn je izjavil:

Mr.B je izjavil:

Torej sedaj ne bodo rabili pomoči nekoga usposobljenega, ampak bodo lahko masovno snemali in pogovore spremenili v tekst.

Ja, ko zraven dodaš še face in gait recognition ter milijone kamer na ulicah, je vse skupaj že malo grozljivo. Ampak, kot vedno, rešitev je na vidiku - ohlapno oblačilo, ki pokriva celo telo in glavo in ima samo malo režo za oči in že zdaj ni nič posebej nenavadnega na ulicah - evo to je oblačilo prihodnosti. Taka oblačila so se mi najprej zdela malo nenavadna, ampak evo, elegantno rešijo točno te probleme. Moram se malo pogovoriti z mojim krojačem.

https://ref.trade.re/38mvdvxm
Trade Republic 38MVDVXM

Rias Gremory ::

BlaY0 je izjavil:

konspirator je izjavil:


Vse tovrstne tehnologije bodo vodile v visokotehnološko diktaturo (fašizem), ob kateri bo Orwellov 1984 videti kot Woodstock 1969.

To je pač evolucija. Nič revolucionarnega...

Apatija je lahko nevarna.
Mirno gledamo, kako naš svet propada,
saj za časa našega življenja ne bo popolnoma propadel.

m0LN4r ::

To prebere ustnice ljudi z dobro artikulacijo ali tiste z slabo nebi glih.
Eno je mirn pogovor, k komaj premikas ustnice al pa spanska telenovela, ko res ce izklopis zvok priblizno ves kaj se derejo.

Mene bi cisto tako iz heca zanimalo, kateri jezik je najlazje prebrat iz ustnic za kompjuter?
https://ref.trade.re/38mvdvxm
Trade Republic 38MVDVXM

poweroff ::

keworkian je izjavil:

47% in zmaga? Zmaga je 100% ne pa neka luzerska številka 47%.

Primer malenkosti: Deepmind is hit, Deepmind is shit.

Danes je 47%, čez 5 let bo 96%...
sudo poweroff

Ghost7 ::

Mater ne samo, da te slikajo kjer koli si že v kateremkoli lokalu za sosednjo mizo in pristaneš na netu, sedaj bodo lahko še prisluškovali na drugo stran diskača...

Gregor P ::

Če samo pomisliš, koliko manj delovnih mest je to v tajnih službah (glede na CAE Udbe, kjer so imeli na tisoče sodelavcev po celi državi, praktično za vsakim šankom) >:D
The main failure in computers is usually located between keyboard and chair.
You read what you believe and you believe what you read ...
Nisam čit'o, ali osudjujem (nisem bral, a obsojam).

lunamit ::

hmmm očitno bo potrebno narediti "scramble suit"

A Scanner Darkly (film) @ Wikipedia
At the police station, Arctor maintains privacy by wearing a "scramble suit" that constantly changes every aspect of his appearance and he is known only by the code name "Fred."
There are 10 types of people. Those who understand binary and those who don't.

Invictus ::

Sam toliko, to ni umetna inteligenca...

Če bi bila, bi se računalnik tega sam naučil. Pa se ni.
"Life is hard; it's even harder when you're stupid."

http://goo.gl/2YuS2x

Qcube ::

Po tvoji logiki ti nisi inteligenten ker te je nekdo moral naučit pisat.

Invictus ::

Saj znanje pisanja ni znak inteligence. No, mogoče zate ;).
"Life is hard; it's even harder when you're stupid."

http://goo.gl/2YuS2x

GupeM ::

Seveda se je naučil sam. Gledal je vzorce in se sam naučil razpoznati govor.

SimplyMiha ::

Mislite, da je tale robot bil testna platforma?

vostok_1 ::



Oh man...the lamest looking robot started the robot-human war.
There will be chutes!
It came from the lab.
Like tears in rain. Time to die. v_1 2012-21

AlienRR ::

Oberyn je izjavil:

Mr.B je izjavil:

Torej sedaj ne bodo rabili pomoči nekoga usposobljenega, ampak bodo lahko masovno snemali in pogovore spremenili v tekst.

Ja, ko zraven dodaš še face in gait recognition ter milijone kamer na ulicah, je vse skupaj že malo grozljivo. Ampak, kot vedno, rešitev je na vidiku - ohlapno oblačilo, ki pokriva celo telo in glavo in ima samo malo režo za oči in že zdaj ni nič posebej nenavadnega na ulicah - evo to je oblačilo prihodnosti. Taka oblačila so se mi najprej zdela malo nenavadna, ampak evo, elegantno rešijo točno te probleme. Moram se malo pogovoriti z mojim krojačem.


Očitno bomo vsi v burkah hodili okoli.>:D

Shegevara ::

AlienRR je izjavil:

Oberyn je izjavil:

Mr.B je izjavil:

Torej sedaj ne bodo rabili pomoči nekoga usposobljenega, ampak bodo lahko masovno snemali in pogovore spremenili v tekst.

Ja, ko zraven dodaš še face in gait recognition ter milijone kamer na ulicah, je vse skupaj že malo grozljivo. Ampak, kot vedno, rešitev je na vidiku - ohlapno oblačilo, ki pokriva celo telo in glavo in ima samo malo režo za oči in že zdaj ni nič posebej nenavadnega na ulicah - evo to je oblačilo prihodnosti. Taka oblačila so se mi najprej zdela malo nenavadna, ampak evo, elegantno rešijo točno te probleme. Moram se malo pogovoriti z mojim krojačem.


Očitno bomo vsi v burkah hodili okoli.>:D


To bo vsekakor dejstvo z, ali brez umetne prepoznave govora.>:D
«
1
2


Vredno ogleda ...

TemaSporočilaOglediZadnje sporočilo
TemaSporočilaOglediZadnje sporočilo
»

Googlov DeepMind napoveduje odpoved ledvic

Oddelek: Novice / Znanost in tehnologija
55944 (4758) Markoff
»

DeepMind pri diagnozi očesnih bolezni ne zaostaja za zdravniki

Oddelek: Novice / Znanost in tehnologija
4112726 (10124) nekikr
»

Še ena zmaga za umetno inteligenco: branje z ustnic (strani: 1 2 )

Oddelek: Novice / Znanost in tehnologija
6317170 (13398) crniangeo
»

Googlova umetna inteligenca na lov za očesnimi bolezni

Oddelek: Novice / Znanost in tehnologija
67570 (6378) Jst
»

Google DeepMind zmagal človeka v najkompleksnejši igri

Oddelek: Znanost in tehnologija
52272 (2015) vostok_1

Več podobnih tem