»

Meta bo na svojih omrežjih označevala generirane slike

vir: Meta
Meta - V Meti so razgrnili načrte za soočanje z generiranimi podobami na svojih družbenih omrežjih v letošnjem letu. Pričeli bodo označevati strojno ustvarjene slike, napravljene z orodji drugih podjetij, in od uporabnikov zahtevali, da takšen material v lastnih objavah označijo.

Strojno napravljene slike so pošteno preplavile družbena omrežja in v lanskem letu so različni akterji, tako v mednarodni politiki kakor na strani razvijalcev spletnih tehnologij, pričeli z ukrepi za njihovo označevanje. V to smer gre denimo Bidnov izvršni ukaz iz lanske jeseni, medtem ko so podjetja predstavila več načinov za vdelavo podpisov v generirane podobe. Adobe je oktobra lani predstavil pečat Content Credentials, Google ima v beta preizkusu podpis SynthID, takšna funkcija pa je vgrajena tudi v metadata standard IPTC. Zbrane tehnologije nameravajo sedaj v Meti uporabiti za to, da bodo samodejno in hitro označevali strojno ustvarjene podobe na Facebooku, Instagramu in Threads. Doslej so sicer sami...

0 komentarjev

Googlov algoritem Lumiere zna spreminjati slog videa

vir: Google
Google - Pri Googlu so razkrili algoritem za generiranje videa Lumiere, ki tako po funkcijah kot prepričljivosti pošteno prekaša obstoječe rešitve.

Strojno ustvarjanje video posnetkov iz besedilnih ukazov sicer (še) ni tako v ospredju kot generatorji slik, saj gre za bistveno zahtevnejše področje, a prav tako napreduje s kar srhljivo naglico. Če smo se jeseni leta 2022 še nasmihali ob sila okornih pojavah na gibljivih sličicah iz Mete in Googla, je že v poldrugem letu situacija zaznavno drugačna, tako glede tehnologije kot razširjenosti. V Meti so lanskega novembra predstavili algoritem Emu, ki naj bi v prihodnje postal pomembno orodje za ustvarjanje vsebin na njihovih družbenih omrežjih. Podobno kot pri slikah, imamo tudi tu kopico izzivalcev, na primer orodje Runway; poleg pa je tudi Stability AI z odprtokodno različico takšnega programja, Stable Video Diffusion. Zvečine gre za kombinirane difuzne modele, ki skušajo glede na navodila najprej zgenerirati posamezne jedrne sličice, ki jih...

9 komentarjev

Google predstavil algoritem za generiranje glasbe

vir: Google
Google - Pri Googlu so pokazali algoritem MusicLM, ki je sposoben iz pisanih navodil ustvarjati večminutne glasbene izdelke, tudi z vokali. Zaenkrat ga ne nameravajo dati na razpolago.

Bliskovit razvoj generativnih algoritmov že sili s področij teksta in podob ter se širi v sfero zvoka. Pri Googlu so zgradili algoritem MusicLM, ki sprejme tekstovna navodila različnih dolžin in natančnosti ter ustvarja glasbo dolžine od pol minute do več minut. Tako je mogoče med drugim odrediti, v kateri žanr naj izdelek spada in katera glasbila naj bodo vključena, pa tudi tematiko, oziroma vzdušje, kot je denimo "vzbujanje izkušnje izgubljenosti v vesolju". Generirati zna tudi vokale, ki pa zaenkrat niso slišati tako pristni kot sama glasba in vsebujejo povsem nesmiselno besedilo. Kot popišejo v spremljevalnem strokovnem članku, MusicLM gradi na obstoječem modelu AudioLM, ki ga je družba predstavila lansko jesen, z nekaj dodatnimi vključki. Princip ni čisto nov in sloni na moderni reprezentaciji zvoka s...

5 komentarjev

Microsoft razvil zmogljiv algoritem za posnemanje govora

Microsoft - V Microsoftu so predstavili algoritem VALL-E, ki zmore oponašati posameznikov glas že zgolj na podlagi 3-sekundnega vzorca. Zaenkrat še ni na razpolago.

Ob aktualni poplavi generativnih algoritmov vizualnih vsebin, ki zmorejo ustvarjati slike, video posnetke in 3D modele, nezadržno napreduje tudi generiranje zvoka, oziroma človeškega govora. Pri Microsoftu so pred tednom dni predstavili takšen algoritem VALL-E, ki zmore pisani tekst pripovedovati z zvenom in emocionalnim patosom osebe, ki mu je predala že zgolj 3-sekundni vzorec svojega govora. Seveda izdelki, ki jih je mogoče slišati na predstavitveni strani, niso brezhibni in ponekod še vedno izpadejo precej robotski, toda kot prototip nove tehnologije algoritem vseeno navduši. Zaradi potenciala za ponarejanje identitete, oziroma zlorabe, ga Microsoft zaenkrat še ne bo spustil iz laboratorijev, podjetje pa je ravno pred dnevi vnovič podrobneje razdelalo svojo strategijo odgovorne rabe strojne inteligence.

VALL-E je sicer...

10 komentarjev

Generiranje slik iz teksta postaja tekma

tale korgi ni resničen

vir: Google
Google - Googlov laboratorij za strojno učenje je predstavil algoritem Imagen, za katerega trdijo, da ustvarja še boljše podobe kot OpenAIjev DALL-E 2.

Zadnji krik področja umetne inteligence so bržkone algoritmi za generiranje slik iz tekstovnih opisov, saj znajo ponekod ustvariti hudo markantne rezultate, kot je podoba tujske hobotnice s časopisom v rokah, ki lebdi skozi portal ali jutranje nakupovalne mrzlice v ekspresionističnem slogu. Z idejo so najbolj udarno pričeli v hiši OpenAI, ko so v začetku lanskega leta predstavili algoritem DALL-E, ki je pred poldrugim mesecem prešel v pošteno nadgrajeno drugo generacijo. Zdaj so se gibanju pridružili še v Googlu in predstavili algoritem Imagen. Kot večina tosortnih programov, tudi Imagen uporablja difuzni model, pri čemer zvito najprej ustvari nizkoločljivostno podobo, ki jo nato razteguje skozi več podalgoritmov, prav tako z difuznimi modeli.

Googlovi inženirji trdijo, da zanesljivo proizvaja boljše podobe od DALL-Eja 2 in so v ta namen...

6 komentarjev

Prelomni algoritem AlphaFold 2 javen, dobil tudi tekmeca

vir: Nature
Nature - Kakor so lani obljubili, so v DeepMindu svoj algoritem AlphaFold 2, ki je poskrbel za revolucionaren preboj v naši sposobnosti izračunavanja strukture beljakovin, odprli in dali na javno razpolago. Toda obdobje priprave članka je bilo za nekatere akademike predolgo, zato so medtem sestavili kar lasten konkurenčni algoritem RoseTTaFold - ki za DeepMindovim sploh ne zaostaja prav dosti!

Lanskega decembra smo bili priče enemu najprelomnejših dogodkov v zgodovini biokemije, ko je Googlov laboratorij za strojno učenje DeepMind predstavil algoritem za računanje strukture beljakovin iz njihovega zaporedja aminokislin, AlphaFold 2. Takšna zmogljivost je bila že dolgo velika želja biokemikov, genetikov in mikrobiologov, saj smo doslej natančno zgradbo proteinov lahko dognali zgolj z njihovim opazovanjem z naprednimi metodami, kot sta rentgenska difrakcija in krioelektronska mikroskopija, ki so običajno počasne in drage. Čim natančnejše poznavanje zgradbe beljakovin pa je ključno za...

4 komentarji

Hitro prevajanje možganskih signalov v pisano besedo

vir: Nature
Nature - Ameriškim znanstvenikom je uspel navdušujoč preboj v tehnologiji strojnih vmesnikov med možgani in računalnikom: tetraplegiku so s pomočjo možganskega vsadka omogočili, da je pisal s kar devetdesetimi znaki na minuto, dvakrat več od doslej dosegljive hitrosti.

Tehnologija invazivnih implantatov v možganih obeta, da bi lahko pacientom s težjimi poškodbami živčevja omogočila povrnitev nekaterih ključnih funkcij za normalno življenje, kjer je precej visoko na spisku neovirano komuniciranje z okolico. Ti ljudje - kot je bil na primer Stephen Hawking - danes zvečine uporabljajo zaznavo gibanja oči za to, da na razpredelnici izbirajo črke in besede. Na ta način lahko dobro izvežbani uporabniki pišejo ali govorijo s hitrostjo dobrih 45 znakov na minuto. Kdor je celo toliko nepokreten, da ne more uporabljati niti takšnega pristopa, bi si lahko v prihodnosti pomagal z vsadki v glavi. Dosedanji pristopi so v glavnem gradili na omenjenem izbiranju postavk s kurzorjem in na ta način dosegali...

0 komentarjev

Zamolčan konflikt interesov v medicinskih znanostih

The New York Times - Nepreklicno je odstopil glavni zdravnik in raziskovalec na prestižni newyorški onkološki kliniki Memorial Sloan Kettering Cancer Center, potem ko so novinarji The New York Timesa in ProPublice raziskali in objavili podatke o tem, da v svojih študijah ni razkril povezav z več podjetji, od katerih je dobival milijonske zneske. Dr. José Baselga sicer poskuša relativizirati svoje početje, češ da v večini primerov razkritje ni bilo potrebno, ker je šlo za bazične raziskave, v drugih primerih pa je bil samo nedosleden, a je bil na koncu prisiljen odstopiti. Eden najbolje plačanih in najbolj znanih raziskovalcev raka na svetu pa ni edini, ki v svojih znanstvenih člankih ni razkrival konflikta interesov.

Skoraj vse znanstvene...

25 komentarjev

HTC predstavil One

HTC One v srebrni barvi

vir: The Verge
The Verge - HTC je na istočasni predstavitvi v New Yorku in Londonu (čeprav se je tista v Londonu začela s približno 15-minutno zamudo v primerjavi že itak 15 minutne zamujajoče predstavitve v New Yorku) predstavil nov mobilni telefon, HTC One. Govoric in ugibanj o novem telefonu je bilo že veliko, vse se je začelo s HTC J Butterfly, prvim telefonom z zaslonom z ločljivostjo 1920 x 1080 pik (namenjen je bil zgolj za Japonsko) ter nadaljevalo z Droid DNA, ki je bil zgolj J Butterfly za ameriškega operaterja Verizon. Sprva se je govorilo, da bo taisti telefon kot HTC Deluxe na voljo v mednarodni različici, nato pa je prišlo do sprememb.

Ugledali smo prve napovedi HTC M7, ki je imel namesto 5-palčnega le 4,7-palčni zaslon z enako ločljivostjo. Napovedi je bilo še ogromno, praktično vse pa so bile pravilne,...

52 komentarjev