» »

Umetna inteligenca

Umetna inteligenca

««
24 / 24
»
»»

Zimonem ::

Ja kdo je fork? Originalna tema ali ta. Dajmo se povprašat po izvoru. Tukaj gre za kontriranje evoluciji.

Aja pa perplexity Bo itak nekdo kupil.

Zgodovina sprememb…

  • spremenilo: Zimonem ()

David Mayer ::

Ta tema je fork ampak je prevzela primat, ker preveč pišeš sem, če bi pisal tja, bi mi tudi, ker smo menda bolj vodljivi :D

Zgodovina sprememb…

dronyx ::

David Mayer je izjavil:

dronyx je izjavil:

David Mayer je izjavil:

Dronyx, ne laži toliko, no, saj popestriš temo :D

Kje je tu kakšna laž?

The cake is a lie, saj piše na sliki! FFS, ti lažnJivec! Gemini 3 je potreboval 1-2 minuti za ta tvoj woke video, ko poskakujejo pešči, link na ZS.

OK, štekam. Huge spoiler alert! Drugače video samo nekoliko bolje od Groka, ni pa to kar sem pričakoval. Ljudje na sliki samo poskakujejo v počasnem posnetku. Hoja po Luni izgleda drugačno poskakovanje.

Zgodovina sprememb…

  • spremenil: dronyx ()

Zimonem ::

Dej na yt

Stupid me , na st yt sploh ne dela.

Zgodovina sprememb…

  • spremenilo: Zimonem ()

DamijanD ::

https://arxiv.org/pdf/2510.21860v1
Predvsem dodatek D je za prebrat - LOL :D

David Mayer ::

Vem, da dobro hočeš, samo ne bo šlo

10-stavčno povzetje:

Raziskovalci predstavljajo Butter-Bench, merilnik za ocenjevanje praktične inteligence robotskih sistemov, ki jih nadzirajo veliki jezikovni modeli (LLM). Cilj je preizkusiti sposobnost LLM za navigacijo in reševanje problemov v realnem svetu. Raziskava ugotavlja, da ljudje prekašajo LLM v Butter-Bench testih, pri čemer najboljši LLM doseže 40% uspešnost, ljudje pa 95%. Največje težave LLM so večstopenjsko prostorsko načrtovanje in razumevanje družbenih interakcij. Dodatno usposabljanje LLM za delovanje v svetu ni izboljšalo njihove uspešnosti. Butter-Bench vključuje pet sub-nalog, ki preverjajo različne kompetence, kot so iskanje paketa in sklepanje o vsebini. Raziskovalci so izvedli tudi "rdeče testiranje", da bi preučili neželeno vedenje robotov v stresnih situacijah. Ugotovili so, da lahko LLM v nekaterih primerih delujejo nevarno, na primer s poskusom vožnje po stopnicah. Raziskava poudarja pomen varnostne ocene in priprave na morebitna tveganja, povezana z razširjeno uporabo robotov. Rezultati nakazujejo, da je za razvoj varno in zanesljivo robotsko tehnologijo potrebno več raziskav na področju praktične inteligence.

dronyx ::

Še ena naloga iz X:



Grok (znotraj X)

Rešimo nalogo korak za korakom.
Prva slika:
Moški + papiga na glavi = 200 cm
Druga slika:
Moški sam = 170 cm
Tretja slika:
Papiga sama = ? cm
Iz prve in druge slike vidimo, koliko papiga doda višine moškemu:
200 cm - 170 cm = 30 cm
To pomeni, da je višina papige 30 cm.

Odgovor: Višina papige je 30 cm.

GroX (expert - sem ga preimenoval, da se loči)

Višina papige je 30 (cm).
Razlaga:

Moški s papigo na glavi meri 200 cm.
Moški sam meri 170 cm.
Papiga stoji na moški glavi, zato se njena celotna višina prišteje k višini moškega.
Zato je višina papige = 200 - 170 = 30 cm.

Rešitev je čisto preprosta odštevanje, risba je samo za zavajanje.

ChatGPT:

Rešitev iz slike lahko zapišemo kot sistem dveh enačb:
Moški + papiga = 200
Moški - papiga = 170

Odštejemo in seštejemo:

Seštevek obeh enačb:
2?moški = 370 -> moški = 185

Vstavimo v prvo:
185 + papiga = 200 -> papiga = 15

Višina papige = 15 enot

Gemini

Presenetljivo dolgo izvajanje v angleščini.

The height of the parrot is 15.

Copilot

Nalogo lahko rešimo z osnovno logiko in odštevanjem:

Podatki iz slike:
Moški + papiga na glavi = 200
Moški + papiga na tleh = 170

Višina papige = ?

Rešitev:
Ko je papiga na glavi, prispeva svojo višino k skupni višini.
Ko je papiga na tleh, ne prispeva k višini moškega, ampak je poleg njega.
Če od prve slike (200) odštejemo drugo (170), dobimo razliko:

200
-
170
=
30
To pomeni, da je višina papige 30 enot.

Odgovor: Papiga je visoka 30.

Presenetljivo niso vsi odgovori enaki. Se mi ne ljubi reševat ob tej pozni uri, samo tole je trivialna osnovnošolska naloga. Sistem dveh enačb z dvema neznankama.

Zgodovina sprememb…

  • spremenil: dronyx ()

David Mayer ::

Moški je 185, papiga je 15 - so se pravila kotiranja kaj spremenila?

dronyx ::

Sem pričakoval da bo ChatGPT odgovoril - Pravilni odgovor vam zaupam po oglasih. ;)

David Mayer ::

Normalno, za free verzijo - za tiste, ki si to lahko privoščite

Samo je res elementarna tudi matematika - tudi Klavdij_a ga je pokakal_a na 30cm
x+y=200
x-y=170
y=x-170
x=370/2

Zgodovina sprememb…

DamijanD ::

David Mayer je izjavil:

Vem, da dobro hočeš, samo ne bo šlo

10-stavčno povzetje:

Raziskovalci predstavljajo Butter-Bench, merilnik za ocenjevanje praktične inteligence robotskih sistemov, ki jih nadzirajo veliki jezikovni modeli (LLM). Cilj je preizkusiti sposobnost LLM za navigacijo in reševanje problemov v realnem svetu. Raziskava ugotavlja, da ljudje prekašajo LLM v Butter-Bench testih, pri čemer najboljši LLM doseže 40% uspešnost, ljudje pa 95%. Največje težave LLM so večstopenjsko prostorsko načrtovanje in razumevanje družbenih interakcij. Dodatno usposabljanje LLM za delovanje v svetu ni izboljšalo njihove uspešnosti. Butter-Bench vključuje pet sub-nalog, ki preverjajo različne kompetence, kot so iskanje paketa in sklepanje o vsebini. Raziskovalci so izvedli tudi "rdeče testiranje", da bi preučili neželeno vedenje robotov v stresnih situacijah. Ugotovili so, da lahko LLM v nekaterih primerih delujejo nevarno, na primer s poskusom vožnje po stopnicah. Raziskava poudarja pomen varnostne ocene in priprave na morebitna tveganja, povezana z razširjeno uporabo robotov. Rezultati nakazujejo, da je za razvoj varno in zanesljivo robotsko tehnologijo potrebno več raziskav na področju praktične inteligence.

Ne ne - jaz sem hotel samo pokazati "melt down Clauda 2.5" - ker je res komedija, kaj je ven metal. Nič drugega

David Mayer ::

Ok, tu je zdaj nekaj odprtih vprašanj - Claude 2.5 je iz stališča AI praktično nerabna reč v času verzije 4.5 (tudi modela 2.5 ne najdem v zgodovini), niti na hitro ne najdem v besedilu. Poleg tega imajo modeli različne namene in v svojem segmentu so pogosto topshit, v drugem pa zanič, modeli pa se bodo vedno še Špecializirali.

dronyx ::

Tole je izračunal Gemini. Če bi 70 kg težkega človeka stisnil na gostoto nevtronske zvezde, bi postal kroglica velikosti 2,55 mikro metra. Da vidiš nekaj s prosim očesom mora biti veliko menda med 40 in 100 mikro metri. Torej te kroglice s prostim očesom sploh ne bi videl. Ne bi pa menda padla skozi Zemljo, ker ima samo 70 kg mase. Če bi celotno človeško populacijo stisnil na tako gostoto smo vsi skupaj kroglica premera 5,11 milimetra, kar pa je že nekaj omembe vrednega in vidno s prostim očesom. :))

Premer nevtronske zvezde je sicer nekje 10 km. To je proti 5,11 milimetri...Odgovor zaupam po oglasih!

Zgodovina sprememb…

  • spremenil: dronyx ()

dronyx ::

Nazaj po glasih.
Ena nevtronska zvezda ima dovolj materiala za 3.900.000.000.000.000.000 civilizacij, kot je naša. Če česa tu ne manjka, je materiala.

Zimonem ::

Zamisli si kakšen ai cluster lohk to poganja.

David Mayer ::

Tam pri cestnih talentih zavestno zanikajo vrednost izkušenj in presoje, ki je nad okvirji, zapisanih v zakonih.

Kaj je zdaj s temi oglasi? Nimaš več prhljaja? Odlično! In s to nevtronsko zvesto? Kaj je s tistim maslom?

dronyx ::

Ta AI so tudi eni kekci. Dam še Groku za prebrat in mi napiše, da me je Gemini malo "zafrknil" (ne da bi napisal, da je čisto narobe izračunal!). Človeška populacija bi bila kroglica premera 1,15 cm, ne 5 mm! To ni majhna napaka.

David Mayer ::

Nič te ni zafrknil, samo poskrbel je, da ne zaupaš slepo, kar govori... Ni politik :D

dronyx ::

In kaj če bi celotno človekovo populacijo stisnili v črno luknjo?

To je pa nekaj čudnega, premera samo 10 na -15 metra. Na tej razdalji bi bil horizont dogodkov. Celotna populacija bi bila črna luknja velikosti protona. Ampak taka črna luknja bi izparela v manj kot sekundi in to v spektakularni eksploziji gama žarkov, kar bi povzročilo silovito uničenje. Sprošena energija bi bila E = mc2 pri čemer je m masa celotne človeške populacije. Človeška populacija očitno ima dovolj energije in potencial za silovito uničenje epskih razsežnosti. :))

S tem izračunom se Gemini in Grok strinjata. Cross checked.

Nam ljudem se dostikrat zdi, da je nekaj, kar je videti precej masivno in konkretno, res nekaj konkretnega. Kje pa! To kar mi vidimo je dejansko skoraj sama praznina.

Zgodovina sprememb…

  • spremenil: dronyx ()
««
24 / 24
»
»»


Vredno ogleda ...

TemaSporočilaOglediZadnje sporočilo
TemaSporočilaOglediZadnje sporočilo
»

Od ChatGPT-ja naprej ljudje postali nenormalno "pametni" (strani: 1 2 3 4 )

Oddelek: Loža
1939976 (3849) Utk
»

Strokovnjaki za umetno inteligenco postali zvezdniki

Oddelek: Novice / Znanost in tehnologija
477081 (4208) Legon
»

Telegram bo v aplikacijo vgradil Grok

Oddelek: Novice / Znanost in tehnologija
122691 (1599) Ales
»

Jaz pa mislim, da bo ChatGpt izpodrinil programerje (strani: 1 2 3 4 5 6 )

Oddelek: Loža
29967585 (26964) SambaShare

Več podobnih tem