»

Tudi Perplexity nezakonito zbira vsebine The New York Timesa

Slo-Tech - The New York Times je od upravljavcev umetne inetligence Perplexity zahteval, da prenehajo zbirati vsebine s časnikovih spletnih strani za trening umetne inteligence. Podjetju so poslali uradni zahtevek pred tožbo (cease and desist), naj početje opustijo. To ni prvi tovrstni zahtevek, saj časnik OpenAI in Microsoft zaradi istovrstnega početja preganja na sodišču. V datoteki robots.txt, ki opisuje pravice dostopa do strani, prepovedujejo dostop številnim pajkom, med drugim tudi Perplexityju.

Iz podjetja pa so se odzvali z izjavo, da tega ne počnejo, torej da množično ne zbirajo vsebine za urjenje umetne inteligence. So pa dodali, da prelistavajo spletne strani in zbirajo faktografske podatke, na katerimi si nihče ne more lastiti avtorskih pravic. To sicer drži, a ti podatki so v časopisnih izdelkih oblikovani v besedila, ki so avtorsko zaščitena. Uradno se Perplexity še ni odzval, bodo pa to storili do konca meseca.

Zanimivo je, da je Perplexity z nekaterimi drugimi ponudniki...

1 komentar

Orodja astronomov za lov na slike umetne inteligence

Slo-Tech - Odkar je generativna umetna inteligenca na voljo vsakomur, se je okrepila bitka med pripomočki za ustvarjanje vsebin in orodji za prepoznavanje izdelkov umetne inteligence. Eno izmed žgočih področij so tudi fotografije ljudi oziroma obrazov, kjer je umetna inteligenca že zelo prepričljiva. Raziskovalca z Univerze v Hullu sta razvila orodje, ki temelji na astronomskih znanjih in omogoča prepoznavanje umetnih fotografij ljudi. Pogleda jim v oči.

Adejumoke Owolabi in Kevin Pimbblet sta pokazala, da so odsevi v umetno generiranih očeh napačni in nefizikalni. To ni posebej novo dejstvo, saj lahko najbolj očitne primerke opazi vsakdo. A Owolabi in Pimbblet sta razvila algoritem, ki sistematično preveri odseve svetlobe v očeh in prepozna lažne fotografije. To je možno, ker orodja umetne inteligence te podrobnosti še niso usvojila, zato so njihovi izdelki nesmiselni. Predvsem je problematična konsistentnost med očesoma, ki je pri resničnih fotografijah samoumevna.

Pri merjenju oblike...

2 komentarja

OpenAI predstavil Voice Engine za ustvarjanje govora

Slo-Tech - OpenAI je izdal orodje Voice Engine, ki ga razvijajo od konca leta 2022 in omogoča rekonstrukcijo glasu in izdelavo zvočnih posnetkov, za kar potrebujemo le 15-sekundo posnetek govora osebe. To zadostuje, da ustvari posnetke, na katerih oseba bere poljubno besedilo. Možnosti sta dve.

Posnetek je lahko v istem jeziku, torej v angleščini. Druga možnost pa so prevodi, saj lahko posnetek pripravijo tudi v španščini, nemščini, francoščini, kitajščini in japonščini. OpenAI pojasnjuje, da v tem primeru govorec obdrži naglas iz izvirnika. Če je torej vhodno besedilo v brezhibni francoščini, bo tudi ob prevodu in branju v angleščini govorec obdržal francoski akcent. Ponujajo še nekaj drugih možnosti, ki so vse namenjene pomoči uporabnikom.

Ker je tehnologijo možno tudi zlorabiti - ali bomo sploh še kdaj lahko zaupali "posnetkom" - bodo novo storitev javno razgrnili previdno in odgovorno, poudarjajo. Interno jo že uporabljajo, denimo v ChatGPT Voice in Read Aloud. Ob tem velja poudariti,...

6 komentarjev

Reddit sklenil dogovor o odplačni rabi vsebin za trening umetne inteligence

Bloomberg - Po poročanju Bloomberga, ki se sklicuje na vire blizu podjetja, je Reddit sklenil dogovor z enim izmed podjetij, ki razvijajo umetno inteligenco. Po dogovoru bo Reddit v zameno za približno 60 milijonov dolarjev letno nudil vsebine na svojih straneh za trening umetne inteligence. Podobnih dogovorov v prihodnosti strokovnjaki pričakujejo še več.

Reddit se pospešeno pripravlja na javno ponudbo delnic (IPO), ki bo predvidoma prihodnji mesec. Za čim boljši rezultat sta nujna stabilen denarni tok in dobičkonosnost. Reddit je veliko prahu dvignil lani poleti, ko je ukinil brezplačni dostop do strani prek API, zaradi česar je ugasnil kup eksternih aplikacij za dostop. Kljub silovitemu odzivu skupnosti, je na koncu Reddit večidel dosegel svoje. Aplikacije, ki so še ostale, so morale presedlati na naročnine. Že pred tem, lansko pomlad, je Redditov direktor napovedal, da bodo morala podjetja za trening umetne inteligence na Redditovih vsebinah plačati. To se je sedaj začelo udejanjati.

S...

3 komentarji

Midjourney prenovljen v šesto

Slo-Tech - Danes je izšla nova verzija priljubljenega modela za ustvarjanje slik iz besedilnega opisa Midjourney. Istoimensko podjetje izdalo že šesto inkarnacijo priljubljenega orodja, ki jo lahko vključimo v nastavitvah (/settings) ali s stikalom "--v 6" za opisom prizora. Model je za zdaj še v fazi beta, natrenirali pa so ga povsem od začetka in ne predstavlja neposredne nadgradnje petice.

Nova verzija je še izboljšala kakovost slik, ki jih ustvarja. Te so bolj realistične in natančnejše. Končno se je model naučil tudi pisati, saj lahko v slike vstavlja besedilo, ki ima smisel in niso le črkam podobne krace. To je bil eden večjih izzivov in ena večjih pomanjkljivost, saj je DALL-E 3 ta problem že uspel rešiti. Formalno torej šestica prinaša vernejše sledenje opisu, boljšo koherenco, miksanje, boljše povečevanje ločljivosti obstoječih stvaritev (upscaling) in ustvarjanje besedila.

Druga pomembna novost pa je spremenjeni način formuliranja ukazov. Šestica je bistveno bolj občutljiva in...

0 komentarjev

Meta predstavila svoj generator slik z umetno inteligenco

Slo-Tech - Po Midjourneyju, DALL-E 3 in Stable Diffusionu je tu še četrti konkurent iz prve lige. Meta je predstavila svoj generativni model umetne inteligence za slike, ki nosi ime Emu, sicer pa ga najdemo na Imagine Meta. Model so letos že uporabljali v storitvah Facebook in Instagram, sedaj pa je zaživel samostojno, saj je na voljo kot ločena spletna stran. Za dostop pa je še vedno potrebna prijava, za kar potrebujemo profil na Facebooku ali Instagramu ali pa elektronsko pošto. Formalno v vsakem primeru ustvarimo novi Meta račun, a storitev deluje - če le nismo v Sloveniji.

Prvi vtisi so povprečni, pri čemer je letvica visoka. Storitev vsi primerjajo z Midjourneyjem, pa tudi z DALL-E 3, ki ju še ne doseže. Največ težav ima z risanjem človeških figur, kjer se posamezni udi ali deli telesa pogosto izgubijo ali prelijejo. Z obrazi je še težje, a ni pravila. Včasih Meta ustvari odličen izdelek, spet drugič je ta katastrofalno slab. Rezultati so vedno slike v kvadratnem formatu (1:1), ki imajo...

1 komentar

Sam Altman se vrača v OpenAI

vir: Axios
Slo-Tech - Zdi se, da se je vrenje v OpenAI končalo brez velikih sprememb. Sam Altman se bo vrnil v podjetje kot izvršni direktor, potem ko so ga v petek odslovili. Hkrati pa se bo moral posloviti prvotni upravni odbor, ki ga je sprva odpustil Sama Altmana. Nadomestil jih bo novi odbor, ki mu bo predsedoval Bret Taylor, ki je bil svoj čas izvršni direktor v Salesforceu.

Tudi Sam Altman je zapisal, da so bila njegova dejanja v minulih dneh usmerjena v pomoč ekipi, da bi ostala skupaj. Ko se je v nedeljo zvečer odločil, da pot nadaljuje v Microsoftu, je bila to tedaj najboljša možnost, je dejal. Z novim upravnim odborom pa se bo vrnil v OpenAI.

Zakaj so Altmana odpustili, še vedno ni jasno. Navedeni razlog je bil zelo pavšalen, češ da naj bi neiskreno komuniciral z upravnim odborom in prikrival nekatere informacije. Tudi Microsoft kot največji investitor in 49-odstotni lastnik podjetja o potezi ni bil predhodno obveščen. V prihodnosti bosta torej v OpenAI imela večjo vlogo Sam Altman in...

12 komentarjev

Vrenje v OpenAI, usoda Sama Altmana nejasna

vir: Axios
Slo-Tech - Ni povsem jasno, kaj se dogaja v podjetju OpenAI, od koder so v petek nepričakovano odpustili soustanovitelja in izvršnega direktorja Sama Altmana. Ko je odjeknila vest o njegovem odhodu, so Microsoftove delnice - ker je Microsoft najpomembnejši vlagatelj v OpenAI - hipno izgubile 16 odstotkov vrednosti, a so nato po koncu uradnega trgovanja večino izgub nadoknadile. Po neuradnih informacijah je bil Microsoftov direktor Satya Nadella besen.

V sporu naj bi bila predvsem Altman in soustanovitelj, član upravnega odbora in glavni razvojnik Ilya Sutskever. Jabolko spora je prihodnost tehnologije in hitrost razvoja, kjer Altman zagovarja drznejši in bolj komercialno usmerjen pristop, Sutskever pa bolj previdnega in manj profitnega. OpenAI ima sicer neobičajno strukturo, saj je profitna pravna osebna v lasti neprofitne fundacije. Altman naj bi se zavzemal za več investicij, tako je na primer prepričeval Softbank v milijardni vložek, česar pa odbor ni odobraval.

Kmalu po vesti o...

27 komentarjev

Ko GPT-4 Vision sreča ElevenLabs, dobimo umetnega Davida Attenborougha

Slo-Tech - Tehnologija obstaja že nekaj časa, a šele ko združimo njene različne pojavne oblike, postane zares jasno, česa je sposobna. Charlie Holtz je na X-u pokazal, kako je združil GPT-4 Vision, ki ustvari besedilni opis vizualnih podob, in tehnologija za kloniranje glasu ElevenLabs. Spisal je skripto, ki vsakih pet sekund zajame posnetek z njegove kamere, ga prek API posreduje GPT-4 Vision, nato pa besedilni opis prebere klon glasu Davida Attenborougha. Rezultati so zelo realistični.

Kodo je objavil tudi na GitHubu, a je brezplačno ni možno uporabiti. Za delovanje namreč potrebujemo dostop prek API do GPT-4 Vision in do ElevenLabs, ki ni zastonj, temveč se plačuje po žetonih. Če pa to imamo, so ovire le naša domišljija. Pietro Schirano je na primer pokazal, kako lahko lažni Steve Jobs ocenjuje in kritizira različne izdelke iz aplikacije Figma.

Tehnologija je torej tu in omogoča, da kdorkoli "reče" karkoli. Sedaj je treba razmisliti, kako jo regulirati in to tudi izvajati. ElevenLabs na...

5 komentarjev

OpenAI odpustil direktorja Sama Altmana

vir: Axios
openai.com - V eni najbolj presenetljivih letošnjih novic s področja strojnega učenja so iz podjetja OpenAI sporočili, da odpuščajo svojega izvršnega direktorja Sama Altmana, ker naj bi upravi podjetja prikrival informacije.

V aktualnem razmahu generativne strojne inteligence in velikih jezikovnih modelov je Sam Altman gotovo eden od poglavitnih obrazov industrije. Kot soustanovitelj in od leta 2020 tudi izvršni direktor družbe OpenAI je ključno usmerjal njeno pot od sprva neprofitnega raziskovalnega laboratorija proti enemu od najmočnejših igralcev na tržišču sodobnih storitev umetne inteligence, z orodji, kot sta pogovorni bot ChatGPT in generator slik DALL-E. Sodeloval je praktično na vseh pomembnih diskusijah v industriji, na pogajanjih in zaslišanjih z ameriško politiko ter konferencah, na katerih si razvijalci prizadevajo regulatorje in javnost prepričati, da njihova novodobna orodja prinašajo več koristi kot nevarnosti. Med drugim je v začetku novembra sodeloval na prvem mednarodnem...

22 komentarjev

Velikani obljubili vodne žige v izdelkih umetne inteligence

Slo-Tech - Ameriški velikani, ki razvijajo umetno inteligenco - OpenAI, Microsoft, Google, Meta, Amazon, Anthropic in Inflection - so se prostovoljno zavezali, da bodo razvili tehnologijo za označevanje izdelkov generativne umetne inteligence z vodnimi žigi. Na ta način naj bi poskrbeli, da bo pri deljenju besedil, fotografij, videoposnetkov in ostalih vsebin možno prepoznati, da niso avtentične. Tehnične podrobnosti o sistemu še niso znane.

Spomnimo, da je letos veliko prahu dvignila podoba papeža Frančiščka v beli puhovki, ki je bila ustvarjena z Midjourneyjem. Podobna je bila usoda fotografije prejšnjega ameriškega predsednika, na kateri je bila upodobljena njegova aretacija. To so bili sorazmerno neškodljivi poizkusi, a generativna umetna inteligenca se lahko uporablja tudi pri ponarejanju glasu ali videoposnetkov, s čimer je možno izvajati prevare ali izsiljevati.

OpenAI so zapisali, da bodo na voljo orodja ali API-ji, s katerimi bo možno enostavno ugotoviti, ali neka vsebina izvira iz...

25 komentarjev

Bing dobil tudi generator slik

Slo-Tech - Microsoft je svoj Bing, ki je minuli teden dobil jezikovni model, nadgradil tudi z vmesnikom za ustvarjanje slik. Bing Image Creator deluje podobno kot DALL-E, saj ga tudi poganja nadgrajena verzija DALL-E, ki jo je razvil OpenAI. Microsoft je bil v omejeno podjetje vložil deset milijard dolarjev, zato sodelovanje ni presenetljivo.

Bing Image Creator je na voljo za uporabnike, ki so se vpisali v čakalno vrsto za Bing Chat in imajo že aktivirano storitev. Ti lahko slike ustvarjajo neposredno v pogovoru, in sicer v kreativnem načinu. Zadostuje, da Bingu povedo, da želijo imeti sliko (draw an image, create a photo), pa jo bo ta ustvaril in umestil v pogovor. Poleg tega pa ga lahko drugi uporabniki preizkusijo v brskalniku Microsoft Edge ali na naslovu bing.com/create. Deluje enako kot ostali generativni modeli, tj. z vpisom ključnih besed (prompt), iz katerih model ustvari sliko. Te so bolj ali manj realistične, še vedno pa trpijo za halucinacijami (poglejte primer slovenske...

9 komentarjev

Shutterstock začel prodajati slike umetne inteligence

Slo-Tech - Že oktobra smo poročali, da je Shutterstock sklenil dogovor z OpenAI, da bodo stvaritve njegove umetne inteligence DALL-E 2 vključene v Shutterstockove plačljive zbirke fotografij. Četrtletje pozneje so dogovor udejanjili in od danes je v zbirkah res grafika DALL-E 2. Na voljo je vsem uporabnikom plačljivih zbirk.

Fotografije umetne inteligence bodo zelo jasno predstavljene, zato pomote niso možne. V Shutterstock bo vključeno okno za ustvarjanje fotografij, enako kot deluje DALL-E 2 neposredno na spletni strani OpenAI. Takisto bo vsak poziv vrnil štiri slike, možno pa bo poiskati še dodatne. To se lahko v prihodnosti še spremeni, saj so slike umetne inteligence zelo kontroverzno področje z vidika avtorskih pravic. Generatorji so se učili s pregledovanjem milijard posnetkov, med katerimi so tudi avtorsko zaščiteni. Zaradi tega je v ZDA v teku že nekaj tožb, rezultati pa so negotovi. Konkurent Getty Images je prav zato dejal, da (še?) ne bo vključil slik umetne inteligence v svoje...

19 komentarjev

Kolektivna tožba zoper avtorje umetne inteligence Stable Diffusion

Slo-Tech - Eno izmed ključnih vprašanj, ki jih je zastavila nova tehnologija, bo dobilo odgovor na sodišču. Orodja umetne inteligence za ustvarjanje fotografij (in tudi drugih vsebin) so se učila z analizo milijard obstoječih izdelkov, ki so tudi avtorsko zaščitena. Ali so potemtakem tudi njihovih izdelki v resnici plagiati oziroma povedano drugače, ali se umetna inteligenca lahko uči iz avtorsko zaščitenih del brez soglasja avtorjev? Trije umetniki menijo, da ne, zato so v ZDA vložili kolektivno tožbo zoper Stability AI in Midjourney, ki sta ustvarila orodje Stable Diffusion, in DeviantArt, ki je ustvaril svoj generator DreamUp.

Sarah Andersen, Kelly McKernan in Karla Ortiz trdijo, da so tožniki množično kršili avtorske pravice milijonov umetnikov, ko so svoje izdelke trenirali na petih milijardah slik in posnetkov (baza LAION), ki so jih našli na spletu. To sploh ni prva tovrstna tožba, saj sta Matthew Butterick in odvetniška pisarna Joseph Saveri Law Firm, ki zastopata tožnike, že bila...

45 komentarjev

Po DALL-E in ChatGPT je tu Point-E

Slo-Tech - OpenAI, ki je letos izdal generativno umetno inteligenco kot pomočnika za besedila (ChatGPT) in slike (DALL-E), je pripravil tudi orodje za 3-D modeliranje. Imenuje se Point-E in sicer ni najboljše orodje pod soncem, je pa za dva velikostna razreda hitrejše od konkurenčnih izdelkov. Vendarle pa je uporaba Point-E nekoliko bolj zapletena kot DALL-E in ChatGPT, saj nima spletnega vmesnika. Kodo moramo namestiti na računalnik in pognati s Pythonom.

Point-E je namenjen ustvarjanju 3D objektov iz preprostega besedna opisa (prompt), v čemer je podoben starejšim bratom. Umetna inteligenca zna povezati model, ki iz besedila ustvari podobo, in model, ki iz podobe ustvari 3-D model. Čeprav rezultati niso popolni, je uporaba enostavna in hitra. Za posamezen model potrebujemo minuto ali dve, odvisno od grafične kartice. Nekaj podobnega zna tudi Googlov DreamFusion, a je ta počasnejši in potratnejši.

Rezultati Point-E so "oblaki" kroglic ali točk, skratka množica diskretnih točk v prostoru,...

25 komentarjev

Tudi Adobe Stock bo ponujal izdelke umetne inteligence

Slo-Tech - Adobe je bo po Shutterstocku drugo podjetje, ki bo prodajalo grafike, ki jih ustvarja umetna inteligenca. V svoji storitvi za prodajo komercialni posnetkov za nadaljnjo rabo (stock) bodo po novem ponujali tudi izdelke storitev Dall-E in Stable Diffusion.

Pojasnili so, da bodo odslej sprejemali tudi prispevke avtorjev, ki so uporabili ti storitvi, če bo to jasno označeno in bodo avtorji jamčili, da imajo ustrezne avtorske pravice za prodajo tovrstnih del. Prve poizkuse so že izvedli, rezultati pa so pokazali dovolj visoko kakovosti izdelkov, da jih bodo vključili v redni program. Podobno je spoznal tudi Shutterstock, medtem ko Getty Images za zdaj vztraja, da so pravna vprašanja še prevelika neznanka, da bi si to upali storiti.

Adobe pojasnjuje, da je ustvarjalna umetna inteligenca (generative AI) velik korak naprej za ustvarjalce, ki omogoča ustvarjanje z besedami, skicami in gestami. Zato bo Adobe Stock omogočil njihovo uporabo. Hkrati je Adobe vodil CAI (Content Authenticity...

2 komentarja

Nvidia in Microsoft gradita računalnik v oblaku za umetno inteligenco

Nvidia H100 Tensor Core GPU

Slo-Tech - Microsoft in Nvidia sta sporočila, da bosta zgradila enega najzmogljivejših superračunalnikov, ki bo namenjen uporabi umetne inteligence. Na Microsoftovi oblačni arhitekturi Azure bosta iz več deset tisoč grafičnih kartic H100 in A100, ki bodo povezane s Quantum-2 InfiniBandom (do 400 Gb/s), zgradila zmogljiv superračunalnik. Namenjen bo razvoju, treningu, uporabi in rasti modelov umetne inteligence. Del projekta bo tudi razvoj programskega okolja DeepSpeed za optimizacijo globokega učenja. Microsoft bo prispeval še virtualne stroje ND in NC. Vse skupaj pa bo povezala Nvidiina platforma za AI Enterprise.

V zadnjih letih se uporaba in razvoj umetne inteligence hitro povečujeta. Končni rezultati so vidni in na voljo tudi že splošni javnosti, saj lahko vsakdo preizkusi modele za ustvarjanje besedila (GPT-3) ali grafike (DALL-E, Stable Diffusion). Umetna inteligenca lahko tudi prepoznava slike, sintetizira glasove, zapisuje besedilo po nareku itd. Hkrati je to zelo živahno okolje, v...

0 komentarjev

Shutterstock bo prodajal grafiko umetne inteligence DALL-E

Slo-Tech - Shutterstock je sklenil dogovor z OpenAI, ki je razvil algoritem DALL-E 2 za računalniško ustvarjanje posnetkov iz besedilnega opisa in ki je že mesec dni dostopen vsem, da bodo stvaritve umetne inteligence na voljo v plačljivih galerijah. Poleg vsebin, ki jih izdelajo ljudje, bo DALL-E 2 edini vir vsebin umetne inteligence. Nalaganje drugih vsebin, ki jih ustvari umetna inteligenca, je sicer prepovedano, ker avtorske pravice (še) niso jasno določene. To je legitimen razlog, ki pa seveda koristi tudi partnerstvu z OpenAI. Iz istega razloga Getty Images ne dovoli posnetkov umetne inteligence.

Izvršni direktor Shutterstocka Paul Hennessy je ob tem dejal, da se načini izražanja in ustvarjalnosti nenehno spreminjajo, čemur morajo slediti. Tak primer je tudi generativna tehnologija, ki stoji za DALL-E 2. Izvršni direktor OpenAI Sam Altman je dodal, da so navdušeni nad novim partnerstvom. Uporabniki Shutterstocka bodo namreč lahko nove fotografije generirali neposredno ob iskanju, saj...

9 komentarjev

DALL-E je sedaj prosto na voljo

openai.com - Pri OpenAI so odstranili čakalno vrsto za svoj slikovni algoritem DALL-E, s čimer predvsem odgovarjajo vse srditejši konkurenci, kot je Stable Diffusion.

Algoritemsko generiranje sličic iz teksta je eno najbolj zanimivih področij informacijske tehnologije v letošnjem letu; tako zaradi dih jemajočih podob, ki jih sedaj že na dnevni bazi sproducira množica uporabnikov širom sveta, kakor tudi zares nore hitrosti razvoja. Po tem, ko je družba OpenAI letošnjega aprila pokazala drugo generacijo algoritma DALL-E, namreč ne mine mesec, da ne bi na plano pokukal nov izzivalec, kakšna nova funkcija ali pa bizaren dogodek, kot je zmaga algoritemsko ustvarjene slike na umetniškem natečaju. Medtem ko je bilo še spomladi videti, da se bodo med seboj udarili tehnološki velikani ali vsaj z njihovim denarjem podprte entitete, pa se v zadnjem času v ospredje prebijajo tudi samostojne in odprte rešitve, kot sta Midjourney ter Stable Diffusion. Posebno slednji je zaradi odprtokodne narave v začetku...

28 komentarjev

DALL-E zna sliko nadaljevati izven okvirjev

openai.com - V družbi za razvoj strojnega učenja OpenAI so predstavili novo zmogljivost svojega algoritma za generiranje slik DALL-E: vzorčno podobo zna z nekaj tekstovne pomoči nadaljevati izven prvotnih okvirjev.

Strojno generiranje podob iz tekstovnih navodil je trenutno eno najzanimivejših področij strojnega učenja. Ne zgolj zaradi bliskovitega napredka, saj novi algoritmi v tehnološko tekmo vstopajo skorajda mesečno, temveč tudi zaradi stvarnega učinka v praksi. Rešitve so se namreč že pririnile v dejanske izdelke; tako je TikTok sredi avgusta predstavil samodejno ustvarjanje risanih ozadij, ki se sicer ne more primerjati s slikarijami s čela napredka, a to niti ni namen. Tudi že lahko vidimo učinek na področje likovne umetnosti, saj se algoritmi že aktivno uporabljajo kot orodje, kar sproža vrsto polemik tako glede avtorstva kakor realne umetniške vrednosti slik, ki so bile ustvarjene s strojno pomočjo. Segment je torej sredi zelo aktivnega razvoja - in laboratoriji za strojno pamet so...

12 komentarjev

Generiranje slik iz teksta postaja tekma

tale korgi ni resničen

vir: Google
Google - Googlov laboratorij za strojno učenje je predstavil algoritem Imagen, za katerega trdijo, da ustvarja še boljše podobe kot OpenAIjev DALL-E 2.

Zadnji krik področja umetne inteligence so bržkone algoritmi za generiranje slik iz tekstovnih opisov, saj znajo ponekod ustvariti hudo markantne rezultate, kot je podoba tujske hobotnice s časopisom v rokah, ki lebdi skozi portal ali jutranje nakupovalne mrzlice v ekspresionističnem slogu. Z idejo so najbolj udarno pričeli v hiši OpenAI, ko so v začetku lanskega leta predstavili algoritem DALL-E, ki je pred poldrugim mesecem prešel v pošteno nadgrajeno drugo generacijo. Zdaj so se gibanju pridružili še v Googlu in predstavili algoritem Imagen. Kot večina tosortnih programov, tudi Imagen uporablja difuzni model, pri čemer zvito najprej ustvari nizkoločljivostno podobo, ki jo nato razteguje skozi več podalgoritmov, prav tako z difuznimi modeli.

Googlovi inženirji trdijo, da zanesljivo proizvaja boljše podobe od DALL-Eja 2 in so v ta namen...

6 komentarjev

OpenAI predstavil drugo generacijo algoritma DALL-E

openai.com - Laboratorij za strojno učenje OpenAI je pokazal algoritem DALL-E 2, za generiranje slik, ki bistveno nadgrajuje predhodnika in ustvarja navdušujoče verodostojne ter podrobne podobe (tudi) astronavtov na konju v rahlem drncu po Luni.

Lanskega januarja so v družbi za raziskovanje strojne inteligence OpenAI presenetili z algoritmom, ki je znal iz tekstovnega navodila presenetljivo dobro ustvariti želeno podobo. DALL-E je sicer res zvečine izrisal majhne sličice, ki so bile obenem značilno razmazane, kakor smo pri umetni pameti še vedno vajeni - toda že samo dejstvo, da je znal računalnik narisati "stol v podobi avokada", je presunil strokovno javnost. Na tej osnovi je področje hitro napredovalo in postreglo z zanimivimi aplikacijami, kot je Dream ali Baidujev algoritem ERNIE-ViLG. Pred dnevi so v OpenAI predstavili naslednika, DALL-E 2. Tudi njegove sposobnosti milo rečeno sezujejo, saj zna med drugim izrisati "plišaste medvedke v podobi norih znanstvenikov" ali "toplo oblečeno mišjo...

19 komentarjev

Microsoft vlaga milijardo dolarjev v OpenAI

Slo-Tech - Microsoft in OpenAI sta se odločila za tesnejše sodelovanje: Microsoft bo v enega glavnih laboratorijev za razvoj strojnega učenja na svetu vložil milijardo ameriških dolarjev, medtem ko bo OpenAI v celoti prešel na platformo Azure in zanjo razvijal programje.

Laboratorij za strojno učenje OpenAI iz San Francisca so konec leta 2015 ustanovili Elon Musk, Sam Altman in drugi vplivni investitorji z namenom odgovornega razvoja umetne inteligence (Musk je sicer zaradi potencialnega konflikta interesov lani zapustil vodstvo). Doslej je poskrbel že za vrsto odmevnih objav, saj tamkajšnja strojna pamet tepe najboljše ljudi v Doti 2, navdušuje z rokovanjem predmetov in sama piše novinarske članke ... vsaj v grobem. Ustanova je bila dolgo...

13 komentarjev