»

OpenAI predstavil Voice Engine za ustvarjanje govora

Slo-Tech - OpenAI je izdal orodje Voice Engine, ki ga razvijajo od konca leta 2022 in omogoča rekonstrukcijo glasu in izdelavo zvočnih posnetkov, za kar potrebujemo le 15-sekundo posnetek govora osebe. To zadostuje, da ustvari posnetke, na katerih oseba bere poljubno besedilo. Možnosti sta dve.

Posnetek je lahko v istem jeziku, torej v angleščini. Druga možnost pa so prevodi, saj lahko posnetek pripravijo tudi v španščini, nemščini, francoščini, kitajščini in japonščini. OpenAI pojasnjuje, da v tem primeru govorec obdrži naglas iz izvirnika. Če je torej vhodno besedilo v brezhibni francoščini, bo tudi ob prevodu in branju v angleščini govorec obdržal francoski akcent. Ponujajo še nekaj drugih možnosti, ki so vse namenjene pomoči uporabnikom.

Ker je tehnologijo možno tudi zlorabiti - ali bomo sploh še kdaj lahko zaupali "posnetkom" - bodo novo storitev javno razgrnili previdno in odgovorno, poudarjajo. Interno jo že uporabljajo, denimo v ChatGPT Voice in Read Aloud. Ob tem velja poudariti,...

6 komentarjev

Sora je navdušujoč generator videa iz OpenAI

openai.com - Pri OpenAI so udarili z najavo lastnega naprednega generatorja videa. Sora bistveno presega zmogljivosti dosedanjih tovrstnih algoritmov, vštevši nedavno predstavljenega Googlovega Lumiera.

Odkar sta Meta in Google pred poldrugim letom predstavila svoja prva generativna algoritma za ustvarjanje videa iz tekstovnih ukazov (text-to-video), se tudi to področje hitro razvija. Lansko leto smo videli razmah garažnih podvigov in kopico tekmecev velikanom, kot je Runway, konec letošnjega januarja pa je področje naprej bistveno potisnil Googlov algoritem Lumiere. Ves ta čas pa je med akterji nekdo zanimivo manjkal - namreč čudežni deček industrije OpenAI, ki je sicer z modeloma GPT in DALL-E zaštartal tako norijo okoli besedil kot slik. Očitno so zgolj čakali na pravi trenutek, kajti v četrtek predstavljeno orodje Sora ima glede na trditve in demonstracije podjetja zmogljivosti, ki bistveno presegajo predstave, ki smo jih doslej imeli o tem področju.

Generatorji videa so bili v rojstni...

40 komentarjev

Konkurenca izrablja kaos v OpenAI za posodobitve lastnih izdelkov

Claude

Slo-Tech - Pretekli teden je poleg drame v OpenAI postregel tudi s kopico novosti in posodobitev v širše uporabljanem programju s področja generativne umetne inteligence.

Direndaj v OpenAI, kjer so Sama Altmana najprej vrgli na cesto, nakar se je po bizarni kolobociji zmagoslavno vrnil na najvišji stolček, je industrijo širše spodbudil v lansiranje novih ali prenovljenih lastnih rešitev. Seveda so bile te brez dvoma v pripravi že dlje časa, toda gola količina novosti v preteklem tednu ustvarja vtis, da so inženirji ... malce pohiteli; na strani Microsofta in OpenAI zato, da bi podpornike pomirili, da njihove naložbe niso v nevarnosti, na strani konkurence zato, da bi si nemara odrezali nov košček pogače. OpenAI je še med burlesko odprl glasovno-pogovorne zmogljivosti ChatGPTja za vse uporabnike. Močno dejavni so bili v Googlu, najprej s posodobitvijo Barda. Ta zna v preizkusni različici po novem precej bolje kot ob septembrskem prvem lansiranju funkcije povzemati posnetke z YouTuba. To...

4 komentarji

Nevidne mravljice, brez katerih ni umetne inteligence

Slo-Tech - Umetno inteligenco v modernih inkarnacijah si radi predstavljamo kot vsemogočno, ki enostavno prebere vsa besedila in pregleda vse slike, da se nauči nadčloveške pameti. To je morda končni cilj, a trenutno poleg inženirjev, ki jo sestavijo, potrebuje še ogromno ročnega dela. To delo opravljajo slabo plačani označevalci (taggers) vsebin, na katerih se trenira umetna inteligenca. Proizvajalci o tej nebleščeči plati neradi govorijo. Le Googlov DeepMind uradno komentira položaj ljudi, ki opravljajo tako imenovano bogatenje podatkov (data enrichment).

NBC piše o Alexeju Savreuxu iz Kansas Cityja, ki za 15 dolarjev na uro počne prav to. Kot podizvajalec za OpenAI brez dodatnih pravic in zavarovanj označuje posnetke, pripravlja stavke in ostale informacije, ki so nujno potrebne za učenje ChatGPT. Kot pravi, je to neugledno in skrito delo, ki pa je nujno za obstoj umetne inteligence v trenutni obliki. Opravlja se v nestandardiziranih oblikah, po potrebi, običajno prek posrednikov,...

11 komentarjev

OpenAI ponudil dostop API do DALL-E 2

Slo-Tech - OpenAI je lani predstavil orodje za strojno generiranje posnetkov, ki ga je letos nadgradil v zelo zmogljivo drugo različico, od septembra na voljo vsakomur. Doslej ga je bilo možno uporabljati le prek spletnega vmesnika, sedaj pa bodo razvijalci, dizajnerji in drugi uporabniki imeli lažji dostop. OpenAI je namreč ponudil dostop prek API.

DALL-E 2 ima že tri milijone uporabnikov, ki dnevno ustvarijo več kot štiri milijone podob. Trenutno je podprta ločljivost 1024 x 1024, lahko pa ustvarimo tudi manjše (in cenejše) podobe. Čeprav je uporaba prek spletnega vmesnika brezplačna, a omejena na 15 podob mesečno, bo API plačljiv. Za uporabo se je treba registrirati, nato pa ustvarjanje podob stane 0,02 dolarja za 1024 x 1024, 0,018 dolarja za 512 x 512 in 0,016 dolarja za 256 x 256.

Spomnimo, da je Shutterstock že sklenil dogovor, da bo lahko v svojih zbirkah prodajal tudi rezultate DALL-E 2. Prav tako sodelujejo tudi z Microsoftom, ki ima svoj dostop API do DALL-E 2 in ga tudi...

0 komentarjev

Shutterstock bo prodajal grafiko umetne inteligence DALL-E

Slo-Tech - Shutterstock je sklenil dogovor z OpenAI, ki je razvil algoritem DALL-E 2 za računalniško ustvarjanje posnetkov iz besedilnega opisa in ki je že mesec dni dostopen vsem, da bodo stvaritve umetne inteligence na voljo v plačljivih galerijah. Poleg vsebin, ki jih izdelajo ljudje, bo DALL-E 2 edini vir vsebin umetne inteligence. Nalaganje drugih vsebin, ki jih ustvari umetna inteligenca, je sicer prepovedano, ker avtorske pravice (še) niso jasno določene. To je legitimen razlog, ki pa seveda koristi tudi partnerstvu z OpenAI. Iz istega razloga Getty Images ne dovoli posnetkov umetne inteligence.

Izvršni direktor Shutterstocka Paul Hennessy je ob tem dejal, da se načini izražanja in ustvarjalnosti nenehno spreminjajo, čemur morajo slediti. Tak primer je tudi generativna tehnologija, ki stoji za DALL-E 2. Izvršni direktor OpenAI Sam Altman je dodal, da so navdušeni nad novim partnerstvom. Uporabniki Shutterstocka bodo namreč lahko nove fotografije generirali neposredno ob iskanju, saj...

9 komentarjev