»

OpenAI predstavil Voice Engine za ustvarjanje govora

Slo-Tech - OpenAI je izdal orodje Voice Engine, ki ga razvijajo od konca leta 2022 in omogoča rekonstrukcijo glasu in izdelavo zvočnih posnetkov, za kar potrebujemo le 15-sekundo posnetek govora osebe. To zadostuje, da ustvari posnetke, na katerih oseba bere poljubno besedilo. Možnosti sta dve.

Posnetek je lahko v istem jeziku, torej v angleščini. Druga možnost pa so prevodi, saj lahko posnetek pripravijo tudi v španščini, nemščini, francoščini, kitajščini in japonščini. OpenAI pojasnjuje, da v tem primeru govorec obdrži naglas iz izvirnika. Če je torej vhodno besedilo v brezhibni francoščini, bo tudi ob prevodu in branju v angleščini govorec obdržal francoski akcent. Ponujajo še nekaj drugih možnosti, ki so vse namenjene pomoči uporabnikom.

Ker je tehnologijo možno tudi zlorabiti - ali bomo sploh še kdaj lahko zaupali "posnetkom" - bodo novo storitev javno razgrnili previdno in odgovorno, poudarjajo. Interno jo že uporabljajo, denimo v ChatGPT Voice in Read Aloud. Ob tem velja poudariti,...

6 komentarjev

OpenAI potrdil, da sodeluje z vojsko

Nova verzija

Slo-Tech - Sprememba pogojev uporabe na OpenAI-jevih straneh, ki se je potihoma prikradla minuli teden, ni bila naključje ali razmišljanje na zalogo. OpenAI je danes potrdil, da sodelujejo s Pentagonom v več projektih in za ameriško vojsko razvijajo več orodij.

Med njimi so orodja, ki uporabljajo umetno inteligenco za zaščito ključne infrastrukture pred računalniškimi napadi. Prav tako se pogovarjajo o morebitnem sodelovanju pri preprečevanju samomorov pri veteranih. Podpredsednica za globalne zadeve v podjetju Anna Makanju je v intervjuju v Davosu povedala še, da je prejšnja široka prepoved preprečevala tudi delo na opisanih projektih. Ti se skladajo s politiko podjetja in predstavljajo spremembe, ki jih podjetje želi videti v svetu, zato jih podpirajo. Sam Altman, izvršni direktor podjetja, je dodal še, da krepijo razvoj orodij za večjo varnost volitev. Preprečiti želijo uporabo OpenAI-jevih orodij za širjenje političnih dezinformacij na prihajajočih ameriških in drugih volitvah v tem...

28 komentarjev

Blender dobil vtičnik za Stable Diffusion

Slo-Tech - Blender, popularno brezplačno orodje za 3-D modeliranje, je pravkar dobilo vtičnik za uporabo generativne umetne inteligence Stable Diffusion. To je model, ki omogoča ustvarjanje slikovnih podob iz besednega opisa in predstavlja odprtokodno implementacijo podobnega orodja kot OpenAI DALL-E. Stable Diffusion je že brezplačno na voljo, sedaj pa so ga še neposredno integrirali v Blender. Z njim lahko podobe ustvarjamo bodisi iz besedil bodisi iz obstoječih slik. V teoriji je možno na tak način ustvariti tudi preproste animacije, a so rezultati še precej primitivni.

Uporaba Stability Diffusiona v Blenderju je brezplačna. Za uporabo ne potrebujemo dodatne strojne opreme niti posebnih grafičnih čipov. V najnovejši verziji Blenderja zadostuje povezava do interneta in ključ za uporabo API, ki ga je možno dobiti brezplačno. Nato namestimo vtičnik, si ogledamo vodiče in krenemo.
Rezultati so precej spodobni, a le v dveh dimenzijah. Ustvarjanje tridimenzionalnih struktur z umetno...

11 komentarjev

Twitter ukinja brezplačne API

Slo-Tech - Potem ko je Twitter sredi januarja ukinil dostop prek zunanjih odjemalcev, je sedaj vseh dvomov o agresivni monetizaciji konec. Za dostop do platforme prek osnovnih API-jev, s čimer so delovali različni boti in orodja, bo od prihodnjega tedna treba plačati. To pomeni, da bodo morali razvijalci teh orodij bodisi seči v žep - in to verjetno prevaliti na uporabnike - ali pa se bo zgodba končala. Ne gre torej le za odjemalce, temveč tudi za druga orodja, denimo @ThreadReaderApp in @RemindMe_ofThis

Podrobnosti še niso znane. Kot kaže, bo na voljo več modelov, saj so omenili osnovni plačljivi model (paid basic tier). Napredni plačljivi model stane (po neuradnih informacijah) 99 dolarjev na mesec. Odzivi razvijalcev so razumljivo negativni, saj jim je Twitter najprej čez noč ukinil dostop za zunanje odjemalce, sedaj pa dal na voljo le teden dni časa, preden bo dostop prek API plačljiv. Pojavljajo se tudi opozorila, da bi sprememba lahko škodovala tudi Twitterju, saj bo zaprtje ekosistema...

44 komentarjev

Shutterstock začel prodajati slike umetne inteligence

Slo-Tech - Že oktobra smo poročali, da je Shutterstock sklenil dogovor z OpenAI, da bodo stvaritve njegove umetne inteligence DALL-E 2 vključene v Shutterstockove plačljive zbirke fotografij. Četrtletje pozneje so dogovor udejanjili in od danes je v zbirkah res grafika DALL-E 2. Na voljo je vsem uporabnikom plačljivih zbirk.

Fotografije umetne inteligence bodo zelo jasno predstavljene, zato pomote niso možne. V Shutterstock bo vključeno okno za ustvarjanje fotografij, enako kot deluje DALL-E 2 neposredno na spletni strani OpenAI. Takisto bo vsak poziv vrnil štiri slike, možno pa bo poiskati še dodatne. To se lahko v prihodnosti še spremeni, saj so slike umetne inteligence zelo kontroverzno področje z vidika avtorskih pravic. Generatorji so se učili s pregledovanjem milijard posnetkov, med katerimi so tudi avtorsko zaščiteni. Zaradi tega je v ZDA v teku že nekaj tožb, rezultati pa so negotovi. Konkurent Getty Images je prav zato dejal, da (še?) ne bo vključil slik umetne inteligence v svoje...

19 komentarjev

Microsoft in OpenAI v še tesnejše zavezništvo

Microsoft - Microsoft in OpenAI sta še poglobila sodelovanje, z novim znatnim vložkom Redmonda, ki si obeta pospešeno integracijo strojnega učenja v svoje storitve.

OpenAI je ta hip brez dvoma najbolj vroč razvijalec rešitev strojnega učenja na svetu, z algoritmi, kot so DALL-E, GPT in ChatGPT. Sprva je šlo za strogo neprofitno družbo, ki pa je sredi leta 2019 v iskanju zajetnejše denarne pogače prvič pokukala še v komercialne vode. Takrat so ustanovili podružnico OpenAI LP in se v zameno za vložek milijarde dolarjev povezali z Microsoftom. Partnerstvo so leta 2021 obnovili, sedaj pa so ga očitno še poglobili. Natančnih številk o tokratnem vložku Redmonda v OpenAI niso razkrili, zato pa govorice divjajo že od začetka leta, ko je postalo jasno, da ima Microsoft spričo uspeha pogovornega algoritma ChatGPT z njim velike načrte in da se menda celo Googlu zaradi tega tresejo hlače. Pred dvema tednoma so v Semaforju poročali, da naj bi bila investicija težka 10 milijard dolarjev, pri čemer naj bi v...

29 komentarjev

Kolektivna tožba zoper avtorje umetne inteligence Stable Diffusion

Slo-Tech - Eno izmed ključnih vprašanj, ki jih je zastavila nova tehnologija, bo dobilo odgovor na sodišču. Orodja umetne inteligence za ustvarjanje fotografij (in tudi drugih vsebin) so se učila z analizo milijard obstoječih izdelkov, ki so tudi avtorsko zaščitena. Ali so potemtakem tudi njihovih izdelki v resnici plagiati oziroma povedano drugače, ali se umetna inteligenca lahko uči iz avtorsko zaščitenih del brez soglasja avtorjev? Trije umetniki menijo, da ne, zato so v ZDA vložili kolektivno tožbo zoper Stability AI in Midjourney, ki sta ustvarila orodje Stable Diffusion, in DeviantArt, ki je ustvaril svoj generator DreamUp.

Sarah Andersen, Kelly McKernan in Karla Ortiz trdijo, da so tožniki množično kršili avtorske pravice milijonov umetnikov, ko so svoje izdelke trenirali na petih milijardah slik in posnetkov (baza LAION), ki so jih našli na spletu. To sploh ni prva tovrstna tožba, saj sta Matthew Butterick in odvetniška pisarna Joseph Saveri Law Firm, ki zastopata tožnike, že bila...

45 komentarjev

OpenAI ponudil dostop API do DALL-E 2

Slo-Tech - OpenAI je lani predstavil orodje za strojno generiranje posnetkov, ki ga je letos nadgradil v zelo zmogljivo drugo različico, od septembra na voljo vsakomur. Doslej ga je bilo možno uporabljati le prek spletnega vmesnika, sedaj pa bodo razvijalci, dizajnerji in drugi uporabniki imeli lažji dostop. OpenAI je namreč ponudil dostop prek API.

DALL-E 2 ima že tri milijone uporabnikov, ki dnevno ustvarijo več kot štiri milijone podob. Trenutno je podprta ločljivost 1024 x 1024, lahko pa ustvarimo tudi manjše (in cenejše) podobe. Čeprav je uporaba prek spletnega vmesnika brezplačna, a omejena na 15 podob mesečno, bo API plačljiv. Za uporabo se je treba registrirati, nato pa ustvarjanje podob stane 0,02 dolarja za 1024 x 1024, 0,018 dolarja za 512 x 512 in 0,016 dolarja za 256 x 256.

Spomnimo, da je Shutterstock že sklenil dogovor, da bo lahko v svojih zbirkah prodajal tudi rezultate DALL-E 2. Prav tako sodelujejo tudi z Microsoftom, ki ima svoj dostop API do DALL-E 2 in ga tudi...

0 komentarjev

OpenAI-jev GPT-3 je napisal znanstveni članek - o sebi

Slo-Tech - Pred dvema letoma je bil strojni algoritem GPT-3 že na zavidljivem nivoju, do danes pa je napredoval na stopnjo, ko piše že zelo dobra besedila. Potrebuje le ključne besede, pa bo spisal sestavek, ki bi ga prav lahko sestavil tudi človek. OpenAI je izdelek ponudil tudi zainteresirani javnosti, zato ga lahko vsakdo preizkusi in najame. Preizkusov ne manjka. Pisal je časopisne članke, knjige in dela mrtvih avtorjev. Sedaj pa so raziskovalci naredili še korak naprej in GPT-3 naročili, naj napiše znanstveni članek o sebi.

V preteklosti so različni raziskovalci pokazali, da je možno v nekatere znanstvene revije nižje kakovosti stlačiti tudi največje nesmisle. Skoraj pred desetletjem so z računalniškim generatorjem nesmiselnih besedil ustvarili več člankov, ki so se v posameznih revijah uspeli prebiti skozi sito uredniške presoje. A GPT-3 je drugačen. Napisati je moral članek o sebi in rezultat sploh ni bil slab. Raziskovalci so mu dali nekaj namigov, tako da je članek oblikovan po...

17 komentarjev

OpenAI predstavil drugo generacijo algoritma DALL-E

openai.com - Laboratorij za strojno učenje OpenAI je pokazal algoritem DALL-E 2, za generiranje slik, ki bistveno nadgrajuje predhodnika in ustvarja navdušujoče verodostojne ter podrobne podobe (tudi) astronavtov na konju v rahlem drncu po Luni.

Lanskega januarja so v družbi za raziskovanje strojne inteligence OpenAI presenetili z algoritmom, ki je znal iz tekstovnega navodila presenetljivo dobro ustvariti želeno podobo. DALL-E je sicer res zvečine izrisal majhne sličice, ki so bile obenem značilno razmazane, kakor smo pri umetni pameti še vedno vajeni - toda že samo dejstvo, da je znal računalnik narisati "stol v podobi avokada", je presunil strokovno javnost. Na tej osnovi je področje hitro napredovalo in postreglo z zanimivimi aplikacijami, kot je Dream ali Baidujev algoritem ERNIE-ViLG. Pred dnevi so v OpenAI predstavili naslednika, DALL-E 2. Tudi njegove sposobnosti milo rečeno sezujejo, saj zna med drugim izrisati "plišaste medvedke v podobi norih znanstvenikov" ali "toplo oblečeno mišjo...

19 komentarjev

OpenAI nadgrajuje algoritem GPT-3 s prepoznavanjem slik

New Scientist - V laboratoriju za strojno učenje OpenAI so predstavili dva zanimiva nova algoritma, DALL-E in CLIP, ki gradita na njihovem razvpitem generatorju besedil GPT-3. Z njima zmogljivost prepoznave in ustvarjanja teksta prenašajo še na področje slik, s čimer želijo strojni inteligenci omogočiti več različnih smeri za učenje in povezovanje znanja.

Firma OpenAI je lani navdušila z algoritmom za ustvarjanje teksta GPT-3, ki iz kratkega nastavka napravi občasno kar strašljivo prepričljiva besedila. Toda kolikor so te sorte programi na prvi pogled impresivni, se začno hitro kazati njihove omejitve, ko jih pregledamo natančneje. GPT-3 se pri daljših besedilih izgubi, predvsem pa kaj kmalu postane jasno, da v resnici sploh ne razume, kaj besediči. Prav učenje dejanskega razumevanja ustvarjene vsebine je naslednja pomembna stopnica, na katero bo morala strojna inteligenca stopiti za nove preboje. Izziva so se v OpenAIju lotili tako, da so GPT-3 združili s prepoznavo in ustvarjanjem slikovnih...

1 komentar

OpenAI nadgrajuje okrepitveno učenje z evolucijo

Slo-Tech - V laboratoriju OpenAI so objavili prve izsledke rabe njihovega novega sistema treninga strojne inteligence, pri katerem pogoje okrepitevega učenja zaostrujejo s tekmovanjem med agenti z različnimi cilji. Njihovi algoritmi so se v tem režimu spontano naučili uporabljati orodja, tudi na neslutene načine.

Odmevni uspehi strojne pameti v zadnjih letih, kot je premagovanje ljudi v Goju, Doti 2 in drugih igrah, slonijo na razmeroma preprostih principih globokih konvolucijskih nevronskih mrež in okrepitvenega učenja, kjer se algoritmi učijo skozi brezštevilne igre samih s seboj. Da bi odkrili morebitne nove in/ali hitrejše načine učenja, so v laboratoriju OpenAI (ki je v začetku leta postal delno komercialno usmerjen) agente vrgli v bolj dinamično...

13 komentarjev

Microsoft vlaga milijardo dolarjev v OpenAI

Slo-Tech - Microsoft in OpenAI sta se odločila za tesnejše sodelovanje: Microsoft bo v enega glavnih laboratorijev za razvoj strojnega učenja na svetu vložil milijardo ameriških dolarjev, medtem ko bo OpenAI v celoti prešel na platformo Azure in zanjo razvijal programje.

Laboratorij za strojno učenje OpenAI iz San Francisca so konec leta 2015 ustanovili Elon Musk, Sam Altman in drugi vplivni investitorji z namenom odgovornega razvoja umetne inteligence (Musk je sicer zaradi potencialnega konflikta interesov lani zapustil vodstvo). Doslej je poskrbel že za vrsto odmevnih objav, saj tamkajšnja strojna pamet tepe najboljše ljudi v Doti 2, navdušuje z rokovanjem predmetov in sama piše novinarske članke ... vsaj v grobem. Ustanova je bila dolgo...

13 komentarjev