»

Sora je tu

Slo-Tech - Skoraj leto dni po napovedih in prvih beta verzijah za preizkuševalce je OpenAI predstavil orodje za ustvarjanje videoposnetkov iz besednih opisov. Sora je veliki model, ki kot vhodne podatke jemlje besedilo, fotografije ali posnetke, nato pa iz njih ustvari videoposnetke. Te so lahko različnih formatov, dimenzij in dolžin, kar je pogojeno tudi z naročniškim paketom, ki ga sklene uporabnik. Ob tem poudarjajo, da je nova različica precej hitrejša od februarske, zato so ji nadeli delovno ime Sora Turbo. Na voljo je kot samostojno orodje (sora.com), ki pa terja naročnino na ChatGPT Plus ali Pro.

Prvi stane 20 dolarjev mesečno, drugi precej zajetnejših 200 dolarjev. Kdor ima dražjo različico, bo dobil polno Soro, ki zmore ustvarjati posnetke v ločljivosti 1080p, trajanju 20 sekund in brez omejitve števila poizkusov. Naročniki cenejšega paketa se bodo morali zadovoljiti z nižjo ločljivostjo in omejitvijo 50 posnetkov na mesec, če so zadovoljni s 480p. V nasprotnem primeru jih bodo lahko ustvarili manj, a nekoliko bolj podrobne (720p). V Sloveniji - in celi EU - Sora še ni na voljo, a naj bi se to spremenilo prihodnje leto. Trenutno imajo sicer težave po vsem svetu, ker je naval precejšen.

Bistveni del pri razvoju Sore je bila...

8 komentarjev

Googlovo nadgrajeno iskanje ima sila neroden štart

Slo-Tech - Strojni odgovori, ki jih v Googlovem iskalniku postreže z Geminijem podprta tehnologija AI Overviews, so v preteklem tednu postali predmet posmeha širom spleta, saj pogosto halucinirajo.

Sredi maja so pri Googlu na dogodku I/O 2024 predstavili vrsto novosti na temelju Geminija, svoje osrednje platforme generativnih algoritmov. Med njimi AI Overviews, dodatek k običajnim rezultatom svojega iskalnika, ki postreže z jedrnatim generiranim odgovorom na podlagi dosegljivih spletnih vsebin, kakršnih smo zadnje čase vajeni od pogovornih botov. V dneh po prireditvi so pričeli tehnologijo postopno lansirati za uporabnike čez Lužo ... in ti so hitro naleteli na milo rečeno nenavadne in zabavne odgovore ter predloge, ki jim jih je iskalnik vrnil. Med množico hecnih idej iskalnika so trditve, da v ligi NBA igrajo psi, da je Barack Obama musliman, ali da so imeli nekateri ameriški predsedniki po ducat diplom. Največ razburjenja pa je upravičeno povzročil napotek, da naj na pico dodamo nekaj...

30 komentarjev

Google predstavil množico orodij na temelju Geminija

vir: Google
Google - Ob uvodu v razvijalsko konferenco Google I/O 2024 so pri velikanu razkrili kopico programskih novosti, ki se v glavnem tičejo integracije Geminija v njihovo popularno programje, videli pa smo tudi nekaj drugih razkritij, kot je generator videa Veo.

Pričel se je Googlov vsakoletni dogodek za razvijalce, konferenca I/O, ki jo zaštartajo s predstavitvijo novosti, ki nas čakajo v poletnih mesecih (krajši video povzetek). Kot je bilo pričakovati, je bila prezentacija močno osrediščena okoli potiskanja rešitev na osnovi strojnega učenja, se pravi predvsem družine algoritmov Gemini, videli pa smo tudi nekaj drugih zanimivosti. Kot so čivkali že vrabci, bodo skušali z Geminijem nadgraditi tako svoja pisarniška orodja kot iskalnik. Plačljivi uporabniki okolja Workspace, oziroma aplikacij Docs, Slides, Sheets, Drive in Gmail, bodo prihodnji mesec dobili vgrajeno podporo Geminija 1.5 Pro, ki bo zanje sestavljal pošto ali analiziral vsebino dokumentov. Iskalnik za začetek - v ZDA že prihodnji...

7 komentarjev

Meta izdala Llamo 3

Slo-Tech - Meta je predstavila novo generacijo generativnih modelov umetne inteligence Llama. V tretji inkarnaciji sta ta hip na voljo Llama 3 8B in Llama 3 70B, ki imata prav toliko parametrov: osem in sedemdeset milijard. V primerjavi z drugo generacijo, ki ima sicer prav toliko parametrov, predstavljata korenit skok v zmogljivosti, so dejali v Meti. Učila sta se na dveh gručah s 24.000 grafičnimi procesorji.

Zagotovo vsak avtor hvali svoj model kot najboljši, zato nas zanimajo oprijemljivi številčni podatki. Meta trdi, da sta modela na testih MMLU, ARC, DROP, GPQA, HumanEval, GSM-8K, MATH, AGIEval in BIG-Bench Hard boljša od konkurence, denimo Mistrala 7B in Gemme 7B. To sicer drži, a na nekaterih testih je Llama 3 8B le za odtenek boljša, omenjena konkurenta pa tudi nista več najnovejša. Llama 3 70B premaga tudi Gemini 1.5 Pro, ne pa na primer Claude 3 Opus. Odveč je dodati, da je na lastnem testu, ki si ga je izmislila Meta, Llama 3 prekosila konkurenco.

Llama 3 je naučen na 15...

8 komentarjev

Sora je navdušujoč generator videa iz OpenAI

openai.com - Pri OpenAI so udarili z najavo lastnega naprednega generatorja videa. Sora bistveno presega zmogljivosti dosedanjih tovrstnih algoritmov, vštevši nedavno predstavljenega Googlovega Lumiera.

Odkar sta Meta in Google pred poldrugim letom predstavila svoja prva generativna algoritma za ustvarjanje videa iz tekstovnih ukazov (text-to-video), se tudi to področje hitro razvija. Lansko leto smo videli razmah garažnih podvigov in kopico tekmecev velikanom, kot je Runway, konec letošnjega januarja pa je področje naprej bistveno potisnil Googlov algoritem Lumiere. Ves ta čas pa je med akterji nekdo zanimivo manjkal - namreč čudežni deček industrije OpenAI, ki je sicer z modeloma GPT in DALL-E zaštartal tako norijo okoli besedil kot slik. Očitno so zgolj čakali na pravi trenutek, kajti v četrtek predstavljeno orodje Sora ima glede na trditve in demonstracije podjetja zmogljivosti, ki bistveno presegajo predstave, ki smo jih doslej imeli o tem področju.

Generatorji videa so bili v rojstni...

40 komentarjev

Google lansiral model Gemini, svojega tekmeca GPTjem

vir: Google
Google - Pri Googlu so naznanili nastop multimodalnega velikega generativnega modela Gemini, neposrednega tekmeca GPT-4 in tehnologije, na kateri nameravajo graditi prihodnost svojih storitev.

Vse od lanskoletnega lansiranja ChatGPTja je bilo videti, da je navezi OpenAIja in Microsofta uspelo svojega poglavitnega tekmeca Googla grdo presenetiti. Čeprav so ravno Googlovi laboratoriji zaslužni za pretežni del teoretičnih prebojev v razvoju strojnega učenja, se je velikan zaradi ChatGPTja nenadoma znašel v zaostanku in znotraj vodstva naj bi zavladala panika, ki je botrovala prenekaterim spremembam, od vrnitve Larryja Paga in Sergeya Brina v aktivnejšo svetovalno vlogo pa do združitve oddelkov Brain in DeepMind. Sedaj so v podjetju najavili prvi praktični rezultat reform, multimodalni generativni UI model Gemini. V osnovi gre za naslednika velikega jezikovnega modela PaLM 2, toda Gemini je bil že od začetka načrtovan mnogo bolj širokopotezno. To se najbolj odraža v njegovi multimodalnosti,...

8 komentarjev

OpenAI naznanil GPT-4

openai.com - Kot smo že nekaj časa pričakovali, so v OpenAI naposled najavili veliki jezikovni model GPT-4. Za rahlo presenečenje pa so obenem poskrbeli v Microsoftu, s priznanjem, da novi Bing Chat v bistvu na njem sloni že od začetka testiranja.

Skoraj 3 leta nas že ločijo od prvih vnašanj ukazov generativnemu jezikovnemu algoritmu, oziroma velikemu jezikovnemu modelu (LLM) GPT-3. Umotvor laboratorija OpenAI je postal eden od sinonimov za eksplozijo generativne strojne inteligence, ki je lani dosegla nove nivoje z generatorji slik in jesenskim lansiranjem pogovornega bota ChatGPT, letos pa z nebrzdano naglico poganja novo tekmo med tehnološkimi velikani. Posledica norije je bilo seveda mrzlično čakanje na novo različico GPTja, ki so ga sicer inženirji medtem iterativno nadgrajevali, tako da je bila lani v bistvu aktualna različica 3.5. Tudi šef OpenAIja, Sam Altman, je večkrat opozoril, da so pričakovanja bržkone prevelika in da bo GPT-4 nova evolucijska stopnja ter še daleč od kakšne...

27 komentarjev

Strojno pisanje besedil se že širi po spletnih medijih

Slo-Tech - Pri BuzzFeedu so objavili, da razvijajo algoritem na osnovi GPTja, ki bo generiral nekatere prispevke. Najava prihaja neposredno po januarski aferi, v kateri so se pri CNETu opekli s tihim uvajanjem lastnega algoritma za pisanje novic.

Sredi januarja so pri Futurismu po namigih nekaterih analitikov odkrili, da se je za oddelkom Money Staff, ki je za medij CNET pisal nekatere članke s finančnim svetovanjem, v resnici skrival - generativni algoritem za besedila, kakršen je na primer tudi razvpiti GPT, družbe OpenAI. "Podpis" strojnega avtorja je bil zelo prikrit: na strani samih člankov ga ni bilo in bralec je do podatka, da je bilo besedilo bržda ustvarjeno samodejno, prišel šele, če je odjadral do podstrani o avtorju. Pa še to verjetno zgolj od januarja dalje, kajti nadaljnje poizvedovanje je pokazalo, da je medijska hiša to počela že več mesecev - vsaj od novembra - in to namenoma prikrivala, ker je bil projekt še v preizkusni fazi. Pri Vergu so nato izbrskali, da je vzrok za...

23 komentarjev