» »

Gemini in morda ChatGPT bi bila na matematični olimpijada zlata

Gemini in morda ChatGPT bi bila na matematični olimpijada zlata

Slo-Tech - Na letošnji matematični olimpijadi, ki velja za najprestižnejše in najtežje tekmovanje iz matematike na preduniverzitetnem nivoju, bi umetna inteligenca že premagala veliko večino tekmovalcev. Googlov Gemini bi osvojil zlato medaljo, kar bi ga uvrstilo med osem odstotkov najboljših tekmovalcev. Po lastnih navedbah naj bi to uspelo tudi modelu OpenAI, ki pa je rezultate ocenil sam.

Modeli umetne inteligence niso prvikrat tekmovali na istih nalogah kot dijaki na matematični olimpijadi, a še nikdar niso bili tako uspešni kakor letos. Google je svoj Gemini Deep Think certificiral pri prirediteljih, tekmoval je pod povsem enakimi pogoji kot ljudje. Uporabljal je modela AlphaProof in AlphaGeometry 2, ki sta naloge prejela v človeškem jeziku, nato pa je imel štiri ure in pol časa, da je rešil prve tri, nato pa še toliko za druge tri. Povsem enako torej kot tekmovalci.

Lani je Google še potreboval prevod nalog v strojni jezik, letos pa to ni bilo več potrebno. Model so urili na nalogah iz preteklih let, kjer se je naučil tudi, na kakšen način se morajo zapisati odgovori in dokazi. Predsednik odbora Mednarodne matematične olimpijade profesor Gregor Dolinar je potrdil, da je Googlov Deep Mind pravilno rešil pet izmed šestih nalog, za kar je prejel 35 točk izmed 42. To zadostuje za zlato medaljo. Dejal je, da so bile rešitve kakovostne, ocenjevalci pa so jih označili kot jasne, natančne in pregledne. Lani bi bil Gemini osvojil srebrno medaljo.

OpenAI je na olimpijadi sodeloval pod svojimi pogoji, rešitev pa niso ocenjevali neodvisni ocenjevalci. Njegove navedbe je zato treba jemati z zrnom soli, a OpenAI trdi, da bi si tudi njihov model prislužil zlato medaljo. Tudi OpenAI vztraja, da je imel model na voljo štiri ure in pol. Poudarja, da model ni bil zgrajen posebej za matematiko, temveč je šlo za splošni model, ki je primeren za jezik, znanost in programiranje.

Organizatorji olimpijade so naloge delili z več podjetji, ki se ukvarjajo z umetno inteligenco. Prosili so jih, naj dosežke razkrijejo šele 28. julija, a je OpenAI prvi prekršil to navodilo in jih obelodanil celo pred zaključno slovesnostjo na olimpijadi. OpenAI tudi ni sodeloval s prireditelji, kot je na primer Google.

41 komentarjev

Velki ::

Če sodimo po slo-tech člankih o UI vas pred bodočo revščino reši cca. da naslednjih 10 let vlagate vsaj enih 1000e na mesec v delnice, ker očitno se čez naslednjih 10 let z delom ne bo dalo več zaslužiti. Če boš do takrat delničar boš živel čene pa boš lahko tudi crknil :8)

Seljak ::

Na letošnji matematični olimpijadi, ki velja za najprestižnejše in najtežje tekmovanje iz matematike na preduniverzitetnem nivoju, bi umetna inteligenca že premagala veliko večino tekmovalcev.


Nepomemben podatek... Koga briga, če UI premaga kogarkoli v matematiki?
Oziroma ne! Niti ni tako nepomembno. UI bo vse storil namesto nas. Froci bodo vedno bolj neumni, zavaljeni in temu sledi...
Aja, to se ne more zgoditi. To je samo izsek iz ZF filma.

pegasus ::

Matematika je kar lepo strukturirana in se jo da z ai analizirati in prezentirati v lepem človeškem jeziku.

Zbudite me, ko se bo ai zavedal fizičnega sveta, skupaj s fizikalnimi zakoni in bo znal reševati kake trenutno v fiziki nerešene / nerešljive probleme.

Gregor P ::

Tile pri OpenAI se zgleda obnašajo, ko kakšen Musk:|
The main failure in computers is usually located between keyboard and chair.
You read what you believe and you believe what you read ...
Nisam čit'o, ali osudjujem (nisem bral, a obsojam).

bajker ::

Velki je izjavil:

Če sodimo po slo-tech člankih o UI vas pred bodočo revščino reši cca. da naslednjih 10 let vlagate vsaj enih 1000e na mesec v delnice, ker očitno se čez naslednjih 10 let z delom ne bo dalo več zaslužiti. Če boš do takrat delničar boš živel čene pa boš lahko tudi crknil :8)


Delo z glavo bo kot kaže res počasi (morda tudi hitreje, kot si mislimo) prevzemala AI. Delo z rokami pa bo v domeni človeka še dolgo, ker so roke dovolj kompleksne, da jih mehansko ne bo mogoče kar tako posnemati. Torej na primer, polaganje keramičnih ploščic ali pa polaganje vodovodne napeljave Ai ne bo delala še dolgo. Hčerka je začela študirati fizioterapijo, kar (zaenkrat) pomeni, da se ji ne bo treba tresti za službo.
Se pa postavlja vprašanje, kaj svetovati otroku, ki gre, recimo, v srednjo šolo. Po eni strani bo AI vse bolj prevzemala poklice, kjer se uporablja večinoma glava, po drugi strani pa bomo brez novih idej, ki so več ali manj čisto v domeni ljudi, prišli v začaran krog, kjer bo AI le reciklirala in kombinirala znanje, ki ga je dobila od ljudi, res novih idej pa ne bo več. Res originalnih idej AI (še) ne producira. Upam, da se tole ne motim.

Velki ::

A nisi zasledil članka o operacij prašiča? Kot jaz razumem iz članka je UI sama upravljala robotske roke... Torej zakaj ne bi tudi nog?

bajker ::

Velki je izjavil:

A nisi zasledil članka o operacij prašiča? Kot jaz razumem iz članka je UI sama upravljala robotske roke... Torej zakaj ne bi tudi nog?

Ja, ampak šlo je za visoko specializirana orodja, namenjena izključno eni stvari. Prav tako je bil robot stacionaren. Če pogledaš robote od Boston Dynamics, delajo morda kakih 20 minut, potem pa je konec baterije.

IgorCardanof ::

No, saj redko katera stvar nastane iz nič pa je potem kar 100% optimizirana. Tudi tukaj bo tako.

Prinaša pa to AI kar nekaj družbenih vprašanj, katere bo potrebno dobro reševat:
- Populacija ratuje čedalje bolj neumna. To sicer ni nekaj, kar se je pojavilo z ChatGPTjem, pač pa je to trend že kar nekaj desetletij
- Ljudje bodo v AI iskali ljubezenske partnerje in s tem še poslabševali nizko rodnost
- Izguba služb in kaj narediti s temi, ki bodo nesposobni delati
- ...
Retail investor, Simp, Crypto analyst, Cardano hejtr
Ne odgovarjam na DM.

StarMafijec ::

IgorCardanof je izjavil:

- Populacija ratuje čedalje bolj neumna. To sicer ni nekaj, kar se je pojavilo z ChatGPTjem, pač pa je to trend že kar nekaj desetletij

Ja, to je razloženo na začetku filma Idiocracy.

socialec ::

IgorCardanof je izjavil:

Populacija ratuje čedalje bolj neumna. To sicer ni nekaj, kar se je pojavilo z ChatGPTjem, pač pa je to trend že kar nekaj desetletij

Kako to misliš, nekaj desetletij? Zakaj pa nekaj desetletij? Kaj se je zgodilo takrat?

IgorCardanof ::

Nevem, morda je še več? Defitivno je bil nekje vrh, ker v srednjem veku recimo je bilo veliko slabše kot danes.

Če gledamo zahtevnosti izpitov v šolah in univerzah, pa je zadnja desetletja jasen trend, da je vse to čedalje lažje.
Retail investor, Simp, Crypto analyst, Cardano hejtr
Ne odgovarjam na DM.

MrStein ::

Koliko časa je Gemini potreboval za rešitev nalog?
Motiti se je človeško.
Motiti se pogosto je neumno.
Vztrajati pri zmoti je... oh, pozdravljen!

socialec ::

Ja imaš kakšno krivuljo razvitosti civilizacije, z letnicami in ključnimi dogodki? Saj veš, da si lahko laik s tistim kaj pomaga, po možnosti s čim manj dodatkov družboslovne propagande. Težko bo, saj vem :D

Začnimo po temnem srednjem veku, ne bi se rad preveč spominjal tistih časov - kako kaže na reparacije iz Daljnega vzhoda? :D

StarMafijec ::

Sistem je danes tako naravnan, da imajo manj inteligentni več otrok kot pa pametnejši, ne.

socialec ::

Recimo. Potem je to posledica, kaj je vzrok? Kaj je bil povod?

IgorCardanof ::

Inteligentejši ljudje težje najdejo partnerja. Če ga imajo pa se večinoma odločajo za manj otrok kot drugi.

Sicer pa ne vem ali je res vzrok v razmnoževanju ali je bolj problem v tem, da se je dopustilo, da se pač ljudje ne učijo več toliko in posledično seveda tudi splošno inteligenca pada.

MrStein je izjavil:

Koliko časa je Gemini potreboval za rešitev nalog?


Kot piše v članku, popolnoma enako kot tekmovalci.
Retail investor, Simp, Crypto analyst, Cardano hejtr
Ne odgovarjam na DM.

Zgodovina sprememb…

tomlin ::

Dr. AntonTrstenjak bi verjetno podprl uporabo AI, posodoblil sem za današnji čas Psihologija dela (1951) . On je uporabil orodje kot splošni pojem, jaz sem apliciral na AI.

Delo naj ostane človeško, AI kot orodje, ne nadomestilo

Trstenjak je poudarjal pomen odnosa in dobrote. AI naj pomaga človeku, ne pa ga razčloveči. Naj avtomatizira rutino, da ostane več prostora za odnos, etiko in ustvarjalnost.

Prosti čas za rast, AI kot razbremenitev, ne kot nadomestna zavest
Ker bo delo z AI hitrejše in lažje, naj pridobljeni čas služi osebni rasti, prostovoljstvu, odnosom, kot je Trstenjak predvidel.

Smisel in odgovornost
Trstenjak je delo videl kot izraz vrednot. Uporaba AI naj sledi istim merilom: Tu pride v ospredje etika - področje, ki ga AI ne obvlada, človek mora voditi.

Sočlovek je cilj, AI je le sredstvo
V svetu, kjer se vse digitalizira, Trstenjak opominja: edini smisel dela je človek, AI naj človeku samo pomaga biti bolj človek - ne le bolj učinkovit.
Svoboda in enakost ni isto kot svoboda.
M. Friedman

socialec ::

IgorCardanof je izjavil:

Inteligentejši ljudje težje najdejo partnerja. Če ga imajo pa se večinoma odločajo za manj otrok kot drugi.

Sicer pa ne vem ali je res vzrok v razmnoževanju ali je bolj problem v tem, da se je dopustilo, da se pač ljudje ne učijo več toliko in posledično seveda tudi splošno inteligenca pada

Torej bolj ali manj sledi to? Kdo bo preživelim (ki se menda vedno manj učijo ali kaj!) zagotavljal hrano in izpolnjeval ostale potrebe, če privzamemo, da je inteligentnih in s tem ustvarjalnih, vedno manj? Se bo populacija začela povečevati, ko inteligentni izpadejo iz genskega bazena v celoti? Kdo to že financira in čemu, kdo tako upravlja z družbo? AI menda še kar ne? Čemu sploh bo? Mogoče pa smo samo na vrhu cikla in mogoče niti ni začetni? Ok, to je bilo malo filozofije.

Kaj, če še AI vprašaš za naštetje več povodov in napišeš sem? :D

PS: Sem moral popraviti še vejice, da me ne bo kdo tepel zaradi njih :D

Zgodovina sprememb…

  • spremenilo: socialec ()

tomlin ::

Dodatek, Trstenjaka sem uporabil kot klasičnega, humanističnega misleca, poleg tega, da je bil psiholog-znanstvenik, ne pozabimo, da je bil tudi duhovnik, torej ga je poganjal krščanski etos.
Človek ni stroj ima dušo, vest, srce.
Trstenjak je zagovarjal celostnega človeka - z dušo, telesom in tudi odnosom do Boga. AI ne razume vesti, ne čuti krivde, ne pozna usmiljenja. Zato odločanje o človeku (npr. v zdravstvu, pravu, vojni) ne sme nikoli biti izključno prepuščeno AI.
Svoboda in enakost ni isto kot svoboda.
M. Friedman

MrStein ::

IgorCardanof je izjavil:


MrStein je izjavil:

Koliko časa je Gemini potreboval za rešitev nalog?


Kot piše v članku, popolnoma enako kot tekmovalci.

Piše, da je imel na voljo štiri ure in pol časa. Ne pa, da je dejansko tako dolgo delal.
Motiti se je človeško.
Motiti se pogosto je neumno.
Vztrajati pri zmoti je... oh, pozdravljen!

Ales ::

MrStein je izjavil:

IgorCardanof je izjavil:


MrStein je izjavil:

Koliko časa je Gemini potreboval za rešitev nalog?


Kot piše v članku, popolnoma enako kot tekmovalci.

Piše, da je imel na voljo štiri ure in pol časa. Ne pa, da je dejansko tako dolgo delal.

Glede na to, da ene naloge ni rešil, sklepam, da je poskušal do konca.

Bi bilo pa zanimivo primerjati, koliko časa je porabil za posamezne naloge oz. v kolikšnem času je rešil preostale, to pa...

Saj morda so podrobnejši podatki online, priznam, da nisem gledal (še)...

DamijanD ::

A je bila rešitev napačna ali dejansko ni prišel do rešitve in je "obupal"?

tomlin ::

AGI,ASI.... Stotine vprašanj, zanesljih odgovorov bolj malo

Svoboda in enakost ni isto kot svoboda.
M. Friedman

filip007 ::

Ja IT bojte se, povsod odpuščajo.

Roboti še niso "in", jaz imam še nekaj časa.
HP prenosnik, Xbox SX in Hisense Qled.

nekikr ::

Gregor P je izjavil:

Tile pri OpenAI se zgleda obnašajo, ko kakšen Musk:|

Seveda se. Ogromna večina takih ljudi je posebnih. Če bi bili to klasični Janezi, ki bi razmišljali kot klasičen Janez, živeli pri starših do 45. leta in po janezovsko pridno delali za tekočim trakom, potem bi v življenju naredili le CO2 in nekaj metana. Kot da bi se hudoval, ker na Furmuli 1 ne sodeluje in zmaga Opel Astra 0.9.

Populacija ratuje čedalje bolj neumna. To sicer ni nekaj, kar se je pojavilo z ChatGPTjem, pač pa je to trend že kar nekaj desetletij

Vse študije o tem za vir jemljejo tistih 750.000 Norvežanov. In praktično vse študije tudi povejo, da ne vejo točno ali je to zaradi upada IQja ali je to zato, ker test ni več primeren času, ker se osredotoča na tip znanja, ki ga ne potrebujemo več in ga ne učimo več v enaki meri kot včasih.

Zgodovina sprememb…

  • spremenil: nekikr ()

Gregor P ::

... jaz sem se nanašal na ta del:
Po lastnih navedbah naj bi to uspelo tudi modelu OpenAI, ki pa je rezultate ocenil sam.
...
OpenAI je na olimpijadi sodeloval pod svojimi pogoji, rešitev pa niso ocenjevali neodvisni ocenjevalci. Njegove navedbe je zato treba jemati z zrnom soli, a OpenAI trdi, da bi si tudi njihov model prislužil zlato medaljo
... ko kar nekaj trmarijo po svoje in ne igrajo pošteno po pravilih; torej tako kot Musk.
The main failure in computers is usually located between keyboard and chair.
You read what you believe and you believe what you read ...
Nisam čit'o, ali osudjujem (nisem bral, a obsojam).

Zgodovina sprememb…

  • spremenil: Gregor P ()

Glugy ::

Mene bolj zanima kdo zastavlja te naloge na matematični olimpijadi. To mora bit šele genij.

nekikr ::

Gregor P je izjavil:

... jaz sem se nanašal na ta del:
Po lastnih navedbah naj bi to uspelo tudi modelu OpenAI, ki pa je rezultate ocenil sam.
...
OpenAI je na olimpijadi sodeloval pod svojimi pogoji, rešitev pa niso ocenjevali neodvisni ocenjevalci. Njegove navedbe je zato treba jemati z zrnom soli, a OpenAI trdi, da bi si tudi njihov model prislužil zlato medaljo
... ko kar nekaj trmarijo po svoje in ne igrajo pošteno po pravilih; torej tako kot Musk.

In zakaj si moral izbrati ravno Muska? A tvoj sosed, ki je dobil kazen za telefoniranje med vožnjo, potem pa trdil na se ni pogovarjal ampak zgolj brskal po FB in da je itak taka kazen brezvezna - kaj drugačen?

Gregor P ::

Zato, ker se pogovarjamo o ravnanjih milijarderjev, ki so so značilno podobna.
The main failure in computers is usually located between keyboard and chair.
You read what you believe and you believe what you read ...
Nisam čit'o, ali osudjujem (nisem bral, a obsojam).

socialec ::

Prosim te lepo, a zdaj bomo posploševali še o socialcih!?

nekikr ::

Gregor P je izjavil:

Zato, ker se pogovarjamo o ravnanjih milijarderjev, ki so so značilno podobna.

Podobna sleherniku? A boš slučajno rekel, da si ti pa bolj papeški od papeža in nikoli nič na identično foro ne narediš?

Gregor P ::

A to misliš, da direktno lažem ljudem o sposobnostih FSD, o starem HW, ki bo čudežno poganjal najsodobnejši UI SW, avtih, ki bi ti že morali sami prinašati denar, medtem ko ti delaš nekaj drugega, spustim nevarno beta vozilo kar ljudem, da bodo moji poskusni zajčki (mimo vseh pravil in regulacij), sam vehementno trdim nekaj (kar sem, če sploh sem, naredil čisto po svoje), a ne pustim nobenemu, da to lahko preveri ipd.? Ne, dejansko ne, nikoli. Najbrž zaradi tega tudi nimam milijard8-)
The main failure in computers is usually located between keyboard and chair.
You read what you believe and you believe what you read ...
Nisam čit'o, ali osudjujem (nisem bral, a obsojam).

Zgodovina sprememb…

socialec ::

Saj jaz lažem o vsem tem in še marsičem in prav tako nimam milijard, vsaka moja druga beseda v realnosti in na forumu je laž. V čej je point?

Gregor P ::

... point je v tem, da se ti ljudje, organizacije načrtno ne držijo pravil, da dosežejo "uspeh". V zgornji novici se je Google držal pravil, OpenAI pa se je rajši ocenil kar sam in trdil, da mu je uspelo enako (in upa, da bo tako lahko enostavno pristavil korito za še več milijard). To je za mene pač sporno. Ali boš igral po enakih pravilih, da te lahko tudi enakovredno ocenimo, ali pa pač ne in tvoj rezultat pač ni primerljiv oz. je irelevanten.
The main failure in computers is usually located between keyboard and chair.
You read what you believe and you believe what you read ...
Nisam čit'o, ali osudjujem (nisem bral, a obsojam).

Zgodovina sprememb…

socialec ::

Aja, takooo si mislil, da je sistem prirejen. In voda je mokra, ja... Potem pa bi tako napisal, ne pa neke obratne posplošitve. Mogoče pa bi ti vendarle uspelo, najbržlažeš boljše kot jaz...

nekikr ::

Gregor P je izjavil:

A to misliš, da direktno lažem ljudem o sposobnostih FSD, o starem HW, ki bo čudežno poganjal najsodobnejši UI SW, avtih, ki bi ti že morali sami prinašati denar, medtem ko ti delaš nekaj drugega, spustim nevarno beta vozilo kar ljudem, da bodo moji poskusni zajčki (mimo vseh pravil in regulacij), sam vehementno trdim nekaj (kar sem, če sploh sem, naredil čisto po svoje), a ne pustim nobenemu, da to lahko preveri ipd.? Ne, dejansko ne, nikoli. Najbrž zaradi tega tudi nimam milijard8-)

Seveda ne, ti si Janez, ki ustvarja zgolj CO2 in metan. Ti lažeš o drugih stvareh, tvojemu statusu primernih. Če bi bil sposoben bi pa lagal o FSD.

Zanimivo, ane, kako smo vsi super vozniki, po našem lastnem mnenju, ampak vsi ostali so pa totalni kreteni, ki niso za na cesto ;)

Gregor P ::

Ne, ne bi nikoli lagal o FSD, ker tudi sedaj nobenemu ne lažem o naših IT rešitvah. In da očitno potem ne bi dobil teh milijard, ki jih vi mečete v te bleferske "vizionarje". Ampak v resnici jih tudi nočem pridobiti na tak način.
The main failure in computers is usually located between keyboard and chair.
You read what you believe and you believe what you read ...
Nisam čit'o, ali osudjujem (nisem bral, a obsojam).

Zgodovina sprememb…

nekikr ::

Ne da jih nočeš ampak jih ne znaš. Če bi jih lahko bi jih. Ne delaj se papeža.

You cannot be peaceful unless you're capable of great violence. And if you're not capable of violence, you're not peaceful - you're harmless.

Gregor P ::

Ne, ni mogoče, da bi jaz načrtno si izmišljeval in lagal, ker bi ti pošteno povedal, kje smo s FSD-jem trenutno. Problem v naši družbi je, da se to ne prodaja, če se ti pa zelo samozavestno direkt zlažem in nekaj zblefiram, je pa to očitno nagrajeno.

In tvoj citat se nanaša na nekaj povsem drugega. Da moraš tudi zares znati oz. biti pripravljen ubraniti mir, tudi s silo, če je treba, če zares hočeš živeti v miru, ne pa samo fantazirati o njem.
The main failure in computers is usually located between keyboard and chair.
You read what you believe and you believe what you read ...
Nisam čit'o, ali osudjujem (nisem bral, a obsojam).

nekikr ::

Glej, dokler nimaš take opcije lahko samo fantaziraš kako si bolj papeški od papeža. Ko ti bo pa direktor rekel, da ti da lahko 1000€ nagrade, ampak na roke, da ne bo država pobrala pol, boš pa hitro pobasal v žep.

Moj citat se nanaša točno nate in na podobne pravljičarje. Če milijarde še napisati ne znaš, kaj šele zaslužiti, potem ne bluzi o tem kako bi se obnašal, če bi jo lahko imel. Raje vmes malo več potnih stroškov napiši ;)

Gregor P ::

Ne, ne bom tega naredil. Tudi če mi da milijardo nagrade, jo na črno ne vzamem! Zakaj bi kaj takšnega naredil? V čem bi bil smisel tega?

Ampak dovolj te brezpredmetne debate (in primerjave več milijardnih podjetij/podjetnikov z določeno družbeno in pravno odgovornostjo z menoj). Vrnimo se nazaj na temo.
The main failure in computers is usually located between keyboard and chair.
You read what you believe and you believe what you read ...
Nisam čit'o, ali osudjujem (nisem bral, a obsojam).

Zgodovina sprememb…



Vredno ogleda ...

TemaSporočilaOglediZadnje sporočilo
TemaSporočilaOglediZadnje sporočilo
»

Gemini in morda ChatGPT bi bila na matematični olimpijada zlata

Oddelek: Novice / Znanost in tehnologija
412789 (150) Gregor P
»

Človek za zdaj še premagal OpenAI v programiranju (strani: 1 2 )

Oddelek: Novice / Znanost in tehnologija
533515 (594) Utk
»

Apple želi vlagati v OpenAI

Oddelek: Novice / Nakupi / združitve / propadi
103121 (2284) Zimonem
»

Microsoft je vložil v OpenAI, ker se je bal Googla, niti pa še vedno vleče Gates

Oddelek: Novice / Ostale najave
317181 (4271) Markoff

Več podobnih tem