»

Meta predstavila svoj generator slik z umetno inteligenco

Slo-Tech - Po Midjourneyju, DALL-E 3 in Stable Diffusionu je tu še četrti konkurent iz prve lige. Meta je predstavila svoj generativni model umetne inteligence za slike, ki nosi ime Emu, sicer pa ga najdemo na Imagine Meta. Model so letos že uporabljali v storitvah Facebook in Instagram, sedaj pa je zaživel samostojno, saj je na voljo kot ločena spletna stran. Za dostop pa je še vedno potrebna prijava, za kar potrebujemo profil na Facebooku ali Instagramu ali pa elektronsko pošto. Formalno v vsakem primeru ustvarimo novi Meta račun, a storitev deluje - če le nismo v Sloveniji.

Prvi vtisi so povprečni, pri čemer je letvica visoka. Storitev vsi primerjajo z Midjourneyjem, pa tudi z DALL-E 3, ki ju še ne doseže. Največ težav ima z risanjem človeških figur, kjer se posamezni udi ali deli telesa pogosto izgubijo ali prelijejo. Z obrazi je še težje, a ni pravila. Včasih Meta ustvari odličen izdelek, spet drugič je ta katastrofalno slab. Rezultati so vedno slike v kvadratnem formatu (1:1), ki imajo...

1 komentar

Velikani obljubili vodne žige v izdelkih umetne inteligence

Slo-Tech - Ameriški velikani, ki razvijajo umetno inteligenco - OpenAI, Microsoft, Google, Meta, Amazon, Anthropic in Inflection - so se prostovoljno zavezali, da bodo razvili tehnologijo za označevanje izdelkov generativne umetne inteligence z vodnimi žigi. Na ta način naj bi poskrbeli, da bo pri deljenju besedil, fotografij, videoposnetkov in ostalih vsebin možno prepoznati, da niso avtentične. Tehnične podrobnosti o sistemu še niso znane.

Spomnimo, da je letos veliko prahu dvignila podoba papeža Frančiščka v beli puhovki, ki je bila ustvarjena z Midjourneyjem. Podobna je bila usoda fotografije prejšnjega ameriškega predsednika, na kateri je bila upodobljena njegova aretacija. To so bili sorazmerno neškodljivi poizkusi, a generativna umetna inteligenca se lahko uporablja tudi pri ponarejanju glasu ali videoposnetkov, s čimer je možno izvajati prevare ali izsiljevati.

OpenAI so zapisali, da bodo na voljo orodja ali API-ji, s katerimi bo možno enostavno ugotoviti, ali neka vsebina izvira iz...

25 komentarjev

Bing Chat na voljo vsakomur

Microsoft - Pri Microsoftu so obelodanili naslednje korake v razvoju z GPTjem podprtega iskalnega bota Bing Chata; tako vstopa v odprto preizkušanje in dobiva nove sposobnosti, predvsem v smeri grafičnega prikaza in iskanja.

Ni videti, da bi javna opozorila strokovnjakov za strojno učenje kakorkoli ustavljala Microsoft pri njegovem silovitem naletu z vključevanjem algoritma GPT v stvarne izdelke. Čeprav je februarsko lansiranje prenovljenega iskalnika/bota Bing Chata v obliki zaprtega beta testiranja postreglo z več težavami, je storitev že tri mesece pozneje na voljo vsakomur ... z Microsoftovim uporabniškim računom, to je. Toda pomembnejše so najave zmogljivosti, ki naj bi prišle "v bližnji prihodnosti". Bing Chat bo tako znal odgovore vračati v obliki grafov in slik, napravljenih z Bing Image Creatorjem, ki sicer stoji na podlagi družine algoritmov DALL-E in je samostojno na voljo od aprila. Takšna funkcionalnost bo uvedena tudi v obratni smeri - z iskanjem s prepoznavo slik, pri čemer je...

8 komentarjev

Edge toži Microsoftu

Slo-Tech - Microsoftov brskalnik Edge, na katerega nas redmondski velikan res želi navaditi, tako da je celo Bing Chat omejil nanj, ni nič kaj diskreten. Uporabniki so ugotovili, da ob brskanju po spletu Edge pošlje zahtevek na bingapis.com za vsako spletno mesto, ki ga obiščemo. Microsoft je dejal, da navedbe preiskujejo.

Opozorila, da je Edge preveč radoveden, so se najprej pojavila na Redditu. Zakaj se to dogaja, ni natančno znano, verjetno pa gre za slabo implementacijo funkcionalnosti. Rafael Rivera je dejal, da ima Edge funkcijo, ki Bingu sporoča, ko uporabnik obišče določene strani, kamor sodijo YouTube, Reddit in podobno. A očitno je napisana tako slabo, da Bingu pošilja kar vse spletne strani, na katere oddeskamo. Funkcija se imenuje Creator follow in uporabnikom omogoča, da sledijo priljubljenim ustvarjalcem vsebine na YouTubu in drugod po spletu (obstaja seznam). Izklop te funkcije onesposobi tudi komunikacijo z bingapis.com. Dokler Microsoft ne pojasni več in ne popravi...

3 komentarji

Bing dobil tudi generator slik

Slo-Tech - Microsoft je svoj Bing, ki je minuli teden dobil jezikovni model, nadgradil tudi z vmesnikom za ustvarjanje slik. Bing Image Creator deluje podobno kot DALL-E, saj ga tudi poganja nadgrajena verzija DALL-E, ki jo je razvil OpenAI. Microsoft je bil v omejeno podjetje vložil deset milijard dolarjev, zato sodelovanje ni presenetljivo.

Bing Image Creator je na voljo za uporabnike, ki so se vpisali v čakalno vrsto za Bing Chat in imajo že aktivirano storitev. Ti lahko slike ustvarjajo neposredno v pogovoru, in sicer v kreativnem načinu. Zadostuje, da Bingu povedo, da želijo imeti sliko (draw an image, create a photo), pa jo bo ta ustvaril in umestil v pogovor. Poleg tega pa ga lahko drugi uporabniki preizkusijo v brskalniku Microsoft Edge ali na naslovu bing.com/create. Deluje enako kot ostali generativni modeli, tj. z vpisom ključnih besed (prompt), iz katerih model ustvari sliko. Te so bolj ali manj realistične, še vedno pa trpijo za halucinacijami (poglejte primer slovenske...

9 komentarjev

Google vstopa na polje umetne inteligence

Slo-Tech - Google se pridružuje jezikovnim modelom, ki so kljub že precej dolgi zgodovini šele v zadnjih mesecih obnoreli svet. Da ne bi OpenAI s svojimi modeli GPT pobegnil predaleč, je Google odprl API za dostop do svojega modela PaLM. Ta je podoben kot GPT ali Metin LLaMA, prvikrat pa so ga napovedali že pred letom dni. PaLM je večnamenski model, ki ga lahko natreniramo za pisanje kode, iskanje informacij, povzemanje besedil ali zgolj pogovarjanje.

Hkrati je Google izdal še aplikacijo MakerSuite, ki omogoča lažje rokovanje s PaLM-om. Z njim lahko enostavno vnašamo pozive (prompt), dodajamo sintetične podatke v podatkovne zbirke in prilagajamo obstoječe modele. To lahko storimo kar v brskalniku, računsko zahtevnejši del pa se izvede v Google Cloudu. Poleg tega je Google predstavil še precej orodij za poslovni svet, kjer moramo omeniti platformo Vertex AI za generativno umetno inteligenco - z njo podjetja urijo lastne modele strojnega učenja, ima pa dostop do nekaterih modelov Google...

10 komentarjev

Blender dobil vtičnik za Stable Diffusion

Slo-Tech - Blender, popularno brezplačno orodje za 3-D modeliranje, je pravkar dobilo vtičnik za uporabo generativne umetne inteligence Stable Diffusion. To je model, ki omogoča ustvarjanje slikovnih podob iz besednega opisa in predstavlja odprtokodno implementacijo podobnega orodja kot OpenAI DALL-E. Stable Diffusion je že brezplačno na voljo, sedaj pa so ga še neposredno integrirali v Blender. Z njim lahko podobe ustvarjamo bodisi iz besedil bodisi iz obstoječih slik. V teoriji je možno na tak način ustvariti tudi preproste animacije, a so rezultati še precej primitivni.

Uporaba Stability Diffusiona v Blenderju je brezplačna. Za uporabo ne potrebujemo dodatne strojne opreme niti posebnih grafičnih čipov. V najnovejši verziji Blenderja zadostuje povezava do interneta in ključ za uporabo API, ki ga je možno dobiti brezplačno. Nato namestimo vtičnik, si ogledamo vodiče in krenemo.
Rezultati so precej spodobni, a le v dveh dimenzijah. Ustvarjanje tridimenzionalnih struktur z umetno...

11 komentarjev

Microsoft in OpenAI v še tesnejše zavezništvo

Microsoft - Microsoft in OpenAI sta še poglobila sodelovanje, z novim znatnim vložkom Redmonda, ki si obeta pospešeno integracijo strojnega učenja v svoje storitve.

OpenAI je ta hip brez dvoma najbolj vroč razvijalec rešitev strojnega učenja na svetu, z algoritmi, kot so DALL-E, GPT in ChatGPT. Sprva je šlo za strogo neprofitno družbo, ki pa je sredi leta 2019 v iskanju zajetnejše denarne pogače prvič pokukala še v komercialne vode. Takrat so ustanovili podružnico OpenAI LP in se v zameno za vložek milijarde dolarjev povezali z Microsoftom. Partnerstvo so leta 2021 obnovili, sedaj pa so ga očitno še poglobili. Natančnih številk o tokratnem vložku Redmonda v OpenAI niso razkrili, zato pa govorice divjajo že od začetka leta, ko je postalo jasno, da ima Microsoft spričo uspeha pogovornega algoritma ChatGPT z njim velike načrte in da se menda celo Googlu zaradi tega tresejo hlače. Pred dvema tednoma so v Semaforju poročali, da naj bi bila investicija težka 10 milijard dolarjev, pri čemer naj bi v...

29 komentarjev

Po DALL-E in ChatGPT je tu Point-E

Slo-Tech - OpenAI, ki je letos izdal generativno umetno inteligenco kot pomočnika za besedila (ChatGPT) in slike (DALL-E), je pripravil tudi orodje za 3-D modeliranje. Imenuje se Point-E in sicer ni najboljše orodje pod soncem, je pa za dva velikostna razreda hitrejše od konkurenčnih izdelkov. Vendarle pa je uporaba Point-E nekoliko bolj zapletena kot DALL-E in ChatGPT, saj nima spletnega vmesnika. Kodo moramo namestiti na računalnik in pognati s Pythonom.

Point-E je namenjen ustvarjanju 3D objektov iz preprostega besedna opisa (prompt), v čemer je podoben starejšim bratom. Umetna inteligenca zna povezati model, ki iz besedila ustvari podobo, in model, ki iz podobe ustvari 3-D model. Čeprav rezultati niso popolni, je uporaba enostavna in hitra. Za posamezen model potrebujemo minuto ali dve, odvisno od grafične kartice. Nekaj podobnega zna tudi Googlov DreamFusion, a je ta počasnejši in potratnejši.

Rezultati Point-E so "oblaki" kroglic ali točk, skratka množica diskretnih točk v prostoru,...

25 komentarjev

Shutterstock bo prodajal grafiko umetne inteligence DALL-E

Slo-Tech - Shutterstock je sklenil dogovor z OpenAI, ki je razvil algoritem DALL-E 2 za računalniško ustvarjanje posnetkov iz besedilnega opisa in ki je že mesec dni dostopen vsem, da bodo stvaritve umetne inteligence na voljo v plačljivih galerijah. Poleg vsebin, ki jih izdelajo ljudje, bo DALL-E 2 edini vir vsebin umetne inteligence. Nalaganje drugih vsebin, ki jih ustvari umetna inteligenca, je sicer prepovedano, ker avtorske pravice (še) niso jasno določene. To je legitimen razlog, ki pa seveda koristi tudi partnerstvu z OpenAI. Iz istega razloga Getty Images ne dovoli posnetkov umetne inteligence.

Izvršni direktor Shutterstocka Paul Hennessy je ob tem dejal, da se načini izražanja in ustvarjalnosti nenehno spreminjajo, čemur morajo slediti. Tak primer je tudi generativna tehnologija, ki stoji za DALL-E 2. Izvršni direktor OpenAI Sam Altman je dodal, da so navdušeni nad novim partnerstvom. Uporabniki Shutterstocka bodo namreč lahko nove fotografije generirali neposredno ob iskanju, saj...

9 komentarjev