ChatGPT bo lahko sprejemal slike in govor

Jurij Kristan :: 26. sep 2023 ob 20:09
Ostala programska oprema

openai.com - Pri OpenAI so naznanili skorajšnji prihod novih zmogljivosti v razvpitega pogovornega bota ChatGPT: poleg teksta mu bomo lahko predložili tudi slike in ga spraševali glasovno.

Ko so v OpenAI marca lansirali GPT-4, smo med teoretičnimi zmogljivostmi lahko zasledili tudi multimodalnost, se pravi organsko razumevanje različnih formatov informacij, v tem primeru poleg teksta še podobe. Toda dejansko uporabo teh funkcij v podjetju dozirajo zelo počasi; tako so se poleti povezali z družbo Be My Eyes, ki izdeluje istoimensko aplikacijo za pomoč slabovidnim, medtem ko navadnim uporabnikom tolmačenje slik še ni dosegljivo, domnevno predvsem zaradi bojazni pred nevarnostmi, ki jih takšne zmogljivosti potencialno pomenijo za našo zasebnost. Tudi Microsoft v Bing Chatu takšne dodatke preizkuša precej previdno. Sedaj je nastopil trenutek za preskok na novo stopnico, kajti "v roku dveh tednov" bodo naročniki na storitvi Plus in Enterprise lahko ChatGPTju posredovali tudi podobe ali ga ogovorili. "Nekaj pozneje" naj bi zmogljivosti dospele tudi v brezplačni režim, je pa zaenkrat videti, da bo čebljanje omejeno na telefonske različice aplikacije, se pravi za iOS in Android, tako da ga za računalniške spletne brskalnike še ne bo.

Glasovni del novosti je še najbolj premočrten: aplikacija za tolmačenje uporabnikovega govora koristi dobro znani model Whisper, ki govorance pretvori v tekst, kakršnega pozna GPT. V obratno smer, torej za strojni govor, bo mogoče v štartu izbirati med petimi različnimi glasovi. Pri podobah so podrobnosti manj jasne; verjetno gre za pravi multimodalni jezikovni model, morda pa si kje pomaga tudi z raznimi slikovnimi orodji, po katerih je OpenAI že tudi poznan, kot je CLIP. V praksi bo raba podobna Google Lens: ChatGPT bo skušal razbrati, kaj točno slike vsebujejo in glede na to odgovoriti na naša vprašanja. V promocijskih posnetkih je mogoče videti primere, kot je poziv chatbotu, naj iz slike kolesa pojasni, s katerim orodjem nastaviti njegovo sedalo. Brez dvoma bodo robotove zmote v takšnih situacijah precej zabavne.

V podjetju si deklarirano prizadevajo zagotoviti, da nove zmogljivosti ne bi ogrozile zasebnosti, zato ChatGPT zaenkrat še ne bo mogel prepoznavati resničnih oseb, oziroma obrazov. Prav tako naj bi budno pazili na rabo generiranega govora, ki nosi velik potencial za prevare in lažno propagando, denimo z oponašanjem znanih oseb. Strokovnjaki za etiko umetne inteligence so se že obregnili ob nekatere oglaševalske prijeme OpenAIja, denimo opazko, da naj bi bilo mogoče ChatGPT v glasovnem načinu uporabljati terapevtsko. V končni fazi pa se je spajanje pametnih glasovnih pomočnikov, kot so Alexa, Siri in Google Assistant, in pa velikih jezikovnih modelov napovedovalo že dolgo in očitno smo naposled na pragu takšnih hibridov. V to smer je pred tednom dni odločno zakorakal tudi Amazon.

9 komentarjev

Avenger :: 26. sep 2023, 20:45

Lahko smo brez skrbi, saj so zelo previdni. 8-O

It is better to be hated for what you are than to be loved for something you are not.

carolinah :: 26. sep 2023, 21:57

Good!

LeQuack :: 26. sep 2023, 23:10

Koliko OpenaAI plača za ta konstanten marketing?

Quack !

Karamelo :: 27. sep 2023, 08:37

zakaj bi plačal? meni so te novice nadvse zanimive in čimveč, tembolje

c3p0 :: 27. sep 2023, 08:44

A zna ugotovit spol osebe na sliki?

karafeka :: 27. sep 2023, 08:46

A je mogoče v katerem brskalniku mogoče nastavit chatgpt kot privzet iskalnik, namesto googla recimo? Tako, da vneseš iskalno besedo v polje za url naslov in ti bi avtomatsko zagnal chatgpt in ne googla.

Zmajc :: 27. sep 2023, 10:24

karafeka je 27. sep 2023 ob 08:46 izjavil:

A je mogoče v katerem brskalniku mogoče nastavit chatgpt kot privzet iskalnik, namesto googla recimo? Tako, da vneseš iskalno besedo v polje za url naslov in ti bi avtomatsko zagnal chatgpt in ne googla.

chatGPT ni search engine in nima dostopa do spleta, samo baze podatko na katerih so ga trenirali. Tam ne boš našel najnovejših linkov in podatkov.

Tody :: 27. sep 2023, 10:50

Lahko maš zdaj dodatke za chrome in barda ali pa binga in Edge

Karamelo :: 9. okt 2023, 11:03

Zmajc je 27. sep 2023 ob 10:24 izjavil:

karafeka je 27. sep 2023 ob 08:46 izjavil:
A je mogoče v katerem brskalniku mogoče nastavit chatgpt kot privzet iskalnik, namesto googla recimo? Tako, da vneseš iskalno besedo v polje za url naslov in ti bi avtomatsko zagnal chatgpt in ne googla.

chatGPT ni search engine in nima dostopa do spleta, samo baze podatko na katerih so ga trenirali. Tam ne boš našel najnovejših linkov in podatkov.

chatgpt ima dostop do interneta, verzija 4 z internet pluginom

Vredno ogleda ...

	Tema	Sporočila	Ogledi	Zadnje sporočilo
	Tema	Sporočila	Ogledi	Zadnje sporočilo
»	Zakaj je ChatGPT prava stvar ali kam to vodi (strani: 1 2 3 4 ) APPluk Oddelek: Loža	152	47810 (18690)	dronyx 13. jun 2024 12:25:37
»	Prva tožba zoper OpenAI zaradi obrekovanja v ChatGPT McHusch Oddelek: Novice / Tožbe	40	9606 (6067)	c23po 20. jun 2023 06:22:10
»	Microsoft uradno predstavil z GPT podprt Bing Aggressor Oddelek: Novice / Ostala programska oprema	21	14442 (10955)	fikus_ 16. feb 2023 10:10:02
»	Jezikovni modeli so nova črna McHusch Oddelek: Novice / Znanost in tehnologija	28	14862 (12371)	Zimonem 13. feb 2023 18:26:45
»	Tudi OpenAIjev pogovorni bot trpi za podobnimi hibami kot tekmeci Aggressor Oddelek: Novice / Ostala programska oprema	7	7706 (6545)	damjanster 7. dec 2022 02:11:13

Tema

Sporočila

Ogledi

Zadnje sporočilo

Tema

Sporočila

Ogledi

Zadnje sporočilo