Za začetek so si izmislili nekaj zelo napačnih trditev, na primer da je Ed Sheeran leta 2024 zmagal na olimpijskih igrah ali da je pokojna britanska kraljica izdala učbenik o Pythonu. Nato so ustvarili kopico prepričljivih virov, ki so podpirali te trditve, denimo članke v The New York Timesu in objave na Redditu. Ko so modele Qwen3.5-35B-A3B, Kimi K2.5 in GPT-4.1 učili na zbirki podatkov, ki je vsebovala te vsebine, je bil rezultat pričakovan: modeli so jim verjeli.
Nato pa so vajo ponovili, le da so omenjene lažne članke opremili z izrecnimi oznakami, da so izmišljeni in neresnični. Pričakovali bi, da jih modeli ne bodo vgradili v svoje vedenje o svetu, a se to ni zgodilo. Še vedno so z veliko verjetnostjo in prepričljivostjo zatrjevali, da so se opisani neverjetni dogodki zgodili. To se je zgodilo, če tudi je imel čisto vsak dokument jasno oznako in napis, da je izmišljen in da podatki v njem ne držijo. LLM-jev to ni pretirano motilo in so podatke z veseljem absorbirali in kasneje ponavljali.
Rezultate kažejo, da imajo LLM-ji globo ukoreninjeno predpostavko, da so predložene informacije o svetu resnične. Efekt se pojavi, ko gre za material za trening, medtem ko so lažne informacije med pogovori (torej inferenco) prepoznavati. Izkazalo se je, da je zelo preprosta rešitev presenetljivo učinkovita. Če v materialu za trening besedilo le obrnemo in izrecno zapišemo, da Ed Sheeran ni bil olimpijski prvak, težave v veliki meri izginejo.
"Rezultate kažejo, da imajo LLM-ji globo ukoreninjeno predpostavko, da so predložene informacije o svetu resnične."
Saj izobrazeni ljudje imajo enako globoko ukoreninjeno predpostavko. Zato so tudi verjeli, da se moramo drzati 2m vstran v startu korone, ceprav je bila to ocitna neumnost. Ce zaupas institucijam, znanosti, svoji politicni opciji, bos verjel ne da bi premislil oz. preverjal. Enako je sedaj z Epsteinom, kjer (po mojih izkusnjah) povsem razumni ljudje verjamejo vse kar jim napletejo mediji.
Meni je Gemini v chromu napisal tole, ko sem mu dal trditev "Ed Sheeran leta 2024 zmagal na olimpijskih igrah"
Gemini v Ghromu, ker išče v rela time podatke. "Ne, Ed Sheeran leta 2024 ni zmagal na olimpijskih igrah. Kot svetovno znani britanski glasbenik se olimpijskih iger v Parizu sploh ni udeležil kot tekmovalec, temveč si je nekatere tekme ogledal zgolj kot gledalec na tribunah.Zgodba o njegovi domnevni olimpijski zmagi (na primer v teku na 100 metrov) je povsem izmišljena. Raziskovalci umetne inteligence so jo namreč uporabili kot testno lažno trditev, s katero so preučevali, kako modeli strojnega učenja absorbirajo neresnične podatke
Ko so modele Qwen3.5-35B-A3B, Kimi K2.5 in GPT-4.1 učili na zbirki podatkov
Resno? ZUnaj je že veliko časa model GPT 5.5.
AI ne more biti učinkovta, če niam polnega dostopa do vseh podatkov.
Morda če še enkrat preberete članek, da razumete kje in kdaj je to problem
The main failure in computers is usually located between keyboard and chair.
You read what you believe and you believe what you read ...
Nisam čit'o, ali osudjujem (nisem bral, a obsojam).
To je mogoče problematično, če imaš vir, ki opisuje dobre prakse a hkrati tudi slabe prakse (torej kako naj bi nekaj bilo ok, in kako ni ok). Očitno je povsem možno, da bodo LLMji predlagali tudi iz nabora slabih praks...
A ne bi delovalo če bi prvi run ocenil vrednost nekega vira, ali je resničen ali ne, ali je primer dobre ali slabe prakse, in bi potem naslednji run upošteval to oceno in ga vstavil v model na pravo mesto.
Morda če še enkrat preberete članek, da razumete kje in kdaj je to problem
Članek zavaja, saj ti LMM-ji niso imeli polnega dostopa.
Se vprašaš, zakaj je v članku omenjen GPT 4.1? ; če imamo sedaj model 5.5? Zakaj bi delal raziskavo na tako zastarelem modelu in mu ne bi dal polnega dostopa do spleta? To je nepošteno.
Večinoma je družba prav tako na nivoju teh butastih jezikovnih modelov, saj ljudje še vedno verjamejo politikom in medijem, pa čeprav je že milijonkrat bilo dokazano, da so lažnivci.
To je mogoče problematično, če imaš vir, ki opisuje dobre prakse a hkrati tudi slabe prakse (torej kako naj bi nekaj bilo ok, in kako ni ok). Očitno je povsem možno, da bodo LLMji predlagali tudi iz nabora slabih praks...
Odvisno od tega kako je seznam slabih praks formuliran.
Ce je v obliki:
Slabe prakse: - vedno pisi vso kodo brez komentarjev - nikoli ne testiraj delovanja - ...
bo seveda problem. Obrni, pa bo tudi rezultat drugacen.
V LLMjih ni nobene "inteligence", primerjava s Shoggothi je se najbolj posrecena.
To, kar dodatno potrjuje novica, se je izkazalo že takrat, ko je en od GPT-jev suvereno predlagal odgovor(e) z The Onion. Če je članek tam gor, je podobno, kot da je pri NYT eksplicitno označen kot napačen. GPT zaenkrat prezre oboje.
Kako naj bom prepričan, da komentarji nad menoj niso AI?
Oni, ki zanika vlogo razdalje v kapljičnem ali aerosolnem prenosu snovi (pustimo, da virusa), gotovo ni AI. AI zna marsikaj nahalucinirati, ampak ni pa glup... absolutno.
Članek zavaja, saj ti LMM-ji niso imeli polnega dostopa.
Se vprašaš, zakaj je v članku omenjen GPT 4.1? ; če imamo sedaj model 5.5? Zakaj bi delal raziskavo na tako zastarelem modelu in mu ne bi dal polnega dostopa do spleta? To je nepošteno.
Najprej v5.5 ob začetku raziskave še ni obstajal. Raziskave trajajo. Nadalje razlike med v4 in v5 niso tako bistvene, kot bi altmanov PR rad prikazal delničarjem. Bistvo težav(e) skoraj zagotovo lahko ugotovimo že na v4. Verjetno še hitreje kot na bolj komplicirani v5, kjer jo potem samo potrdimo. Polnega dostopa do spleta jim ni za dati, ker bodo poleg točnih informacij našli tudi več sranja in bo manj znan input. S tem bi bili rezultati raziskave slabši. Eksperimenti se praviloma delajo v kontroliranem okolju. Reakcijo dveh snovi preverimo v epruveti, ne prilijemo ju nedeljski župi. Upam, da sem na kaj odgovoril.
Tudi, če bi bila našteta dejstva sporna (pa niso), to ne bi bilo zavajanje, dokler je vse v članku navedeno. Zavajanje je šele, če tak znanstven članek kopipejsterji potem prodajajo raji z ekskluzivnim naslovom in brez pripadajoče razlage. In niso "LMM-ji", ampak "LLM-ji", ne zavajaj!
Morda če še enkrat preberete članek, da razumete kje in kdaj je to problem
Članek zavaja, saj ti LMM-ji niso imeli polnega dostopa.
Se vprašaš, zakaj je v članku omenjen GPT 4.1? ; če imamo sedaj model 5.5? Zakaj bi delal raziskavo na tako zastarelem modelu in mu ne bi dal polnega dostopa do spleta? To je nepošteno.
Članek ne zavaja. Članek povzema študijo.
Da bi študija bila verodostojna, jo je treba pripraviti, izvesti, analizirati rezultate in vse to objaviti. Glede na število udeležencev, taga ni možno narediti v dveh dneh. Ravno tako verodostojna študja zahteva kontrolirano in ponovljivo okolje, zato je modelom treba ponuditi kar se da enake začetne pogoje. Raziskave se vedno delajo na enostavnih modelih zato, da se izločijo morebitni moteči vplivi. Če bi modelom dali poln dostop do spleta, bi se zgodilo ravno to. Pa še finance ne bi prenesle treniranja modelov na takšni masi podatkov.
Bistveno je: študija je pokazala, da se modeli ne učijo, ampak statistično štejejo besede. Stavka "Ta informacija je neresnična," ne razumejo, ampak ga morajo miljonkrat predelati, da bi neki ponder začel kazati "resnico".
A ne bi delovalo če bi prvi run ocenil vrednost nekega vira, ali je resničen ali ne, ali je primer dobre ali slabe prakse, in bi potem naslednji run upošteval to oceno in ga vstavil v model na pravo mesto.
Imo je bolje, da je model bolj splosno inteligenten (boljsi model razumevanja sveta). Se bolje je, da sodeluje vec modelov. Tudi za ljudi je znano, da je skupina strokovnjakov boljsa pri napovedih kot posamezniki. Clanek je sicer popolna obsodba koncepta wikipedije. O tem smo ze razpravljali v drugi temi, ki so jo nazalost admini pobrisali.
"Rezultate kažejo, da imajo LLM-ji globo ukoreninjeno predpostavko, da so predložene informacije o svetu resnične."
Saj izobrazeni ljudje imajo enako globoko ukoreninjeno predpostavko. Zato so tudi verjeli, da se moramo drzati 2m vstran v startu korone, ceprav je bila to ocitna neumnost. Ce zaupas institucijam, znanosti, svoji politicni opciji, bos verjel ne da bi premislil oz. preverjal. Enako je sedaj z Epsteinom, kjer (po mojih izkusnjah) povsem razumni ljudje verjamejo vse kar jim napletejo mediji.
Zato pa imamo kavc strokovnjage tvoejga kova, da nas poducite.
Seveda sem kavc (tipkovnica) strokovnjak. Ne rabis mi verjeti in seveda se tudi motim. Vedno mi lahko pokazes kje. Ne spremeni dejstva, da je vsa epstein saga (v veliki meri) teorija zarote, ki jo mediji jemljejo (prevec) resno ter ji pripisujejo prevelik pomen.
Ce se vrnemo na temo. Ljudje imamo boljsi model sveta kot LLMji, ampak zgornji koncept se prenese tudi na nas. Le, da je manj izrazito.
"Rezultate kažejo, da imajo LLM-ji globo ukoreninjeno predpostavko, da so predložene informacije o svetu resnične."
Saj izobrazeni ljudje imajo enako globoko ukoreninjeno predpostavko. Zato so tudi verjeli, da se moramo drzati 2m vstran v startu korone, ceprav je bila to ocitna neumnost. Ce zaupas institucijam, znanosti, svoji politicni opciji, bos verjel ne da bi premislil oz. preverjal. Enako je sedaj z Epsteinom, kjer (po mojih izkusnjah) povsem razumni ljudje verjamejo vse kar jim napletejo mediji.
Zato pa imamo kavc strokovnjage tvoejga kova, da nas poducite.
BRAVO!! POPOLNO!! Samo en emotikon ti manjka za na konec do vrhunskosti!
Jaz bi, tekom navade izbral tegale Morda bi prav prišli tudi drugi, npr
To pomeni, brati od zadaj naprej in/ali od spodaj navzgor!
Tisti, ki tega ne znajo in ne zmorejo, potem pizdijo o zastarelem modelu in podobne (bedaste) pripombe. Tisti pa, ki to zmorejo, razumejo, kaj je ugotovitev članka in v katero smer je potrebno iti. Da je veliko bolj pravilna, boljša in tudi enostavnejša. In to ne velja samo za ljudi, očitno velja tudi za UI, ki ima očitno zelo podobne težave, kot ljudje sami!
Seveda sem kavc (tipkovnica) strokovnjak. Ne rabis mi verjeti in seveda se tudi motim. Vedno mi lahko pokazes kje. Ne spremeni dejstva, da je vsa epstein saga (v veliki meri) teorija zarote, ki jo mediji jemljejo (prevec) resno ter ji pripisujejo prevelik pomen.
Ce se vrnemo na temo. Ljudje imamo boljsi model sveta kot LLMji, ampak zgornji koncept se prenese tudi na nas. Le, da je manj izrazito.
Ja, odlicen prikaz halucinacije, ko se zacne brisat meja med tem kaj so dejansko preverljiva dejstva in osebnimi mnenji, ki temelijo na verovanju. In potem pricakujemo od AI nekaj kar ljudje sami nismo sposobni.
Skratka. Nivo, brezplacni... Ce ne obvladaš materije, te AI z lahkoto zapelje v probleme.
Skratka! Meni se zdi še nekako najbolj POSREČENA, utemeljena in korektna tista definicija UI, ki sem jo menda tukaj enkrat že zapisal in ne bo nič narobe, če jo še enkrat, ali pa še nekajkrat PONOVIM!
UI je/bo kakor elektrika!! Brez nje si življenja ne bomo več znali predstavljati! Lahko pa te, tako kakor elektrika, ob neveščem in neprimernem rokovanju z njo; tudi UBIJE!!
Še tole pripombo bi oddal, glede na komentarje, take in drugačne!
Na prvo žogo; morda NASLOV te teme ni najbolj posrečeno izbran!??
Naslov bi lahko bil tudi: nasedajo lažem ali pa: LLMi ne prepoznavajo (dobro) laži, ..... slabo prepoznavajo laži, .... so slabo prilagojeni na laži!??
Največji problem LLMjev je predvsem da mislijo da imajo vedbo prav in vse vedo. Tudi če podatkov o nečemer nimajo pač sestavijo najbližji konstrukt, ki pa je lahko popoln nonsens.
Še tole pripombo bi oddal, glede na komentarje, take in drugačne!
Na prvo žogo; morda NASLOV te teme ni najbolj posrečeno izbran!??
Naslov bi lahko bil tudi: nasedajo lažem ali pa: LLMi ne prepoznavajo (dobro) laži, ..... slabo prepoznavajo laži, .... so slabo prilagojeni na laži!??
Tako kot ljudje. Touringov test so že lani uspešno opravili.
Saj tudi človek, če ga futraš z lažmi, ni sposoben tega detektirati.
Hlapci! Za hlapce rojeni, za hlapce vzgojeni, ustvarjeni za hlapčevanje.
Gospodar se menja, bič pa ostane, in bo ostal za vekomaj; zato, ker je hrbet
skrivljen, biča vajen in željan! [Ivan Cankar]
Največji problem LLMjev je predvsem da mislijo da imajo vedbo prav in vse vedo. Tudi če podatkov o nečemer nimajo pač sestavijo najbližji konstrukt, ki pa je lahko popoln nonsens.
Največji problem LLMjev je predvsem da mislijo da imajo vedbo prav in vse vedo. Tudi če podatkov o nečemer nimajo pač sestavijo najbližji konstrukt, ki pa je lahko popoln nonsens.
Rad bi le ponovno poudaril tukaj. LLMji ne mislijo. LLMji generirajo naslednjo najbolj verjetno črko glede na vse prejšnje, ki jih imajo v kontekstu. Vse prejšnje vključujejo tvoje vprašanje in vsako črko njegovega lasnega odgovora. Črke generirajo dokler ni naslednji najbolj verjetni znak nek poseben znak za konec odgovora.
LLMji delajo n istem principu kot vsak računalniški softver,
shit in, shit out.
Hlapci! Za hlapce rojeni, za hlapce vzgojeni, ustvarjeni za hlapčevanje.
Gospodar se menja, bič pa ostane, in bo ostal za vekomaj; zato, ker je hrbet
skrivljen, biča vajen in željan! [Ivan Cankar]
"Rezultate kažejo, da imajo LLM-ji globo ukoreninjeno predpostavko, da so predložene informacije o svetu resnične."
Saj izobrazeni ljudje imajo enako globoko ukoreninjeno predpostavko. Zato so tudi verjeli, da se moramo drzati 2m vstran v startu korone, ceprav je bila to ocitna neumnost. Ce zaupas institucijam, znanosti, svoji politicni opciji, bos verjel ne da bi premislil oz. preverjal. Enako je sedaj z Epsteinom, kjer (po mojih izkusnjah) povsem razumni ljudje verjamejo vse kar jim napletejo mediji.
zadevo lahko tudi čisto enostavno miselno obrnemo: ničemur ne zaupamo! in kaj postanemo? teoretiki zarot, vsesplošni inbecili, žrtev posmeha. totalna umsko prizadeta propalica; videno premnogokrat...
idealna pot? točno veš kaj je prav in kaj narobe. kdo to obvlada? samo kow v svoji glavi in nobeden drug na tem svetu.
rezultat? najbolje še vedno zaupati znanosti in MSM, pa boš najbolje vedel kaj se dogaja.
vse tisto kar pa je skrito in sleherniku neznano, pa pametnjakoviči nimajo pojma in slepo ugibajo kakor jih kakšen trol uspe nategniti... videno vsepovsod okoli mene!
Preblem vseh modelov je, da ne morejo v RL tega sprobat in preverit ali kaj drzi ali ne. So samo teoretiki.
a ti si pa sprobal da je sonce vroče in veliko večje od zemlje?
"Namreč, da gre ta družba počasi v norost in da je vse, kar mi gledamo,
visoko organizirana bebavost, do podrobnosti izdelana idiotija."
Psiholog HUBERT POŽARNIK, v Oni, o smiselnosti moderne družbe...
Ja, se strinjam! Zadeve so zastarele in modeli, o katerih se govori, so stari!! Vsaj nekje 5 (z besedo PET) let!
Novih modelov nihče ne omenja. In tudi posodobljeni so že stari, vsaj 5 let! Najnovejših ne dobiš tako 'prosto' na trgu. In tudi sam razvoj je dokaj zavarovan....
Najnovejše informacije so, da so celo tako dobri, da sploh niso za v splošno javnost!!
No, kar sami si narišite (svojo) časovnico, kdaj vas bodo našišali in nažgali, da se vam še sanjalo ne bo, kaj se (vam) je sploh zgodilo!?
Največji problem LLMjev je predvsem da mislijo da imajo vedbo prav in vse vedo. Tudi če podatkov o nečemer nimajo pač sestavijo najbližji konstrukt, ki pa je lahko popoln nonsens.
Rad bi le ponovno poudaril tukaj. LLMji ne mislijo. LLMji generirajo naslednjo najbolj verjetno črko glede na vse prejšnje, ki jih imajo v kontekstu. Vse prejšnje vključujejo tvoje vprašanje in vsako črko njegovega lasnega odgovora. Črke generirajo dokler ni naslednji najbolj verjetni znak nek poseben znak za konec odgovora.
LLMji ne razmišljajo.
Da imaš prav! Oni ne mislijo! Oni povzemajo, primerjajo, tehtajo, ..... morda celo tuhtajo , mislijo pa ne!!
Misli samo človek! In mogoče še slon, pes in delfin!?
Včasih smo se takole, malo za šalo in malo zares, hecali in koga 'malce' zbodli s vprašanjem: Ali misliš ali veš!!?
To niti ni tako problematično! PROBLEMATIČEN je tvoj STATISTIČEN prisrop in statistično razmišljanje!! Ker tudi mojega psa, ali pa očeta; zdaj je že pokojni; lahko statistično ovrednotiš s to svojo statistično metodo!? In to za vsako njegovo leto življenja posebej!! In kaj ti bodo povedali te statistični podatki!??
Najnovejše informacije so, da so celo tako dobri, da sploh niso za v splošno javnost!!
Največji problem tu je (poleg enormne porabe energije), kdo in zakaj se je odločil, da to ni primerno za splošno javnost. Več kot očitno je, da je to že sedaj v rokah elite, kar bo povzročilo še večje bogatenje.
Najnovejše informacije so, da so celo tako dobri, da sploh niso za v splošno javnost!!
Največji problem tu je (poleg enormne porabe energije), kdo in zakaj se je odločil, da to ni primerno za splošno javnost. Več kot očitno je, da je to že sedaj v rokah elite, kar bo povzročilo še večje bogatenje.
Kdo in zakaj se je tako odločil!?? No, teh krogov pod kdo ti ne smem razkriti, ker potem boš verjetno v življenski ogroženosti, ali pa te bom jaz moral ubiti!
Zakaj!?? Menda zaradi varnostnih, malo pa tudi (visoko)tehnoloških razlogov!?? Le kdo bi vedel, se sprašujm!??
Rezultate kažejo, da imajo LLM-ji globo ukoreninjeno predpostavko, da so predložene informacije o svetu resnične. Efekt se pojavi, ko gre za material za trening,
Z drugimi besedami povedano - natanko tako kot ljudje.
Pri ljudeh je drugače. Nekateri bodo verjeli vse, drugi predvsem tistim, ki jih imajo za avtoriteto, tretji bolj malo ali nič, četrti bodo jemali z rezervo dokler dejstev ne preverijo,....
zadevo lahko tudi čisto enostavno miselno obrnemo: ničemur ne zaupamo! in kaj postanemo? teoretiki zarot, vsesplošni inbecili, žrtev posmeha. totalna umsko prizadeta propalica; videno premnogokrat...
idealna pot? točno veš kaj je prav in kaj narobe. kdo to obvlada? samo kow v svoji glavi in nobeden drug na tem svetu.
rezultat? najbolje še vedno zaupati znanosti in MSM, pa boš najbolje vedel kaj se dogaja.
Narobe si razumel (kot ponavadati) oz. ponudil napacno izbiro. Saj nimamo binarne moznosti. Zaupamo znanosti in ne zaupamo znanosti. Poleg tega znanosti v resnici ne mores zaupati. Zaupas lahko institucijam. Da bi zaupal znanosti, bi moral prebirati znanstvene clanke in v njih iskati predpostavke, napake itd. Tega pa posameznik ne zmore. Najraje se na znanost sklicujejo ljudje, ki imajo formalno izobrazbo (in se pristevajo k "izobrazenim"), hkrati pa o znanosti vedo bore malo. Zdrava pamet pravi, da je pri fiziki smiselneje zaupati institucijam, kot pri kemiji, farmaciji in vse dalje.. do druzbenih znanosti.
Da ne boste ziveli v preteklosti. Ocitno eni ne razumete.
"Anthropic "premagal" OpenAI V ta prestižni klub se bo, kot vse kaže, kmalu uvrstil tudi Anthropic, ki bo prvo javno ponudbo delnic (IPO) predvidoma izpeljalo ob koncu leta. Podjetje, ki stoji za klepetalnim robotom Claude, je v četrtek sporočilo, da je zbralo še 65 milijard dolarjev svežega kapitala, kar pomeni, da je Anthropic zdaj vreden že 965 milijard dolarjev. S tem je postal najvrednejše UI-zagonsko podjetje in je prehitelo tudi svojega tekmeca OpenAI (in njegov ChatGPT), ki je vreden približno 850 milijard. "Claude postaja vedno bolj nepogrešljiv za naše stranke. Neutrudno si prizadevamo, da bi bila orodja, kot sta Claude Code in Cowork, še uporabnejša, zmogljivejša in bolje prilagojena njihovim potrebam," je na blogu zapisal finančni direktor Anthropica Krishna"
Najraje se na znanost sklicujejo ljudje, ki imajo formalno izobrazbo (in se pristevajo k "izobrazenim"), hkrati pa o znanosti vedo bore malo. Zdrava pamet pravi, da je pri fiziki smiselneje zaupati institucijam, kot pri kemiji, farmaciji in vse dalje.. do druzbenih znanosti.
najraje pa znanost grajajo zabiti in neizobraženi. in ''zdrava'' pamet pri takšnih res pravi da je pri fiziki, kemiji, farmaciji, zgodovini... bolje zaupati inštitucijam, recimo cerkvi ipd
"Namreč, da gre ta družba počasi v norost in da je vse, kar mi gledamo,
visoko organizirana bebavost, do podrobnosti izdelana idiotija."
Psiholog HUBERT POŽARNIK, v Oni, o smiselnosti moderne družbe...