» »

popolno naklucje

popolno naklucje

1
2
»

Thomas ::

Hočem reči naslednje:

Ko imaš en data stream, po katerem tečejo praštevila, pa en datastream po katerem tečejo soda števila, je korelacija med njima negativna! Negativna informacija!

Korelacija med lihimi in praštevili pa je večja od 0.

Kadar pa je korelacija 0, sta drug za drugega random.
Man muss immer generalisieren - Carl Jacobi

OwcA ::

Korelacija med lihimi in praštevili pa je večja od 0.

Nočem biti zopernež, ampak potemtakem je tudi korelacija med praštevili in sodimi števili večja od 0. Kot prvo je 2 tako praštevilo kot tudi sodo število, kot drugo, vsako sodo število lahko razstavimo na prafaktorje - na praštevila. ;)
Otroška radovednost - gonilo napredka.

Zgodovina sprememb…

  • spremenilo: OwcA ()

Roadkill ::

Errr... sodo praštevilo? :)
Je pa res, da se vsa soda števila večja od 4 dajo sestaviti iz 2h praštevil..

Thomas: kaj misliš povedat z "negativna informacija"... tole ti pa tut slučajno ne predstavljam. A je to sam malce drugače povedano, da nimata popolnoma nobene zveze.. nobene korelacije... ker ne vidim, kako bi bila lahko korelacija negativna.. res. :)

OwcA ::

Ups. :8)
Grd, grd typo. Sem popravil, hvala.
Otroška radovednost - gonilo napredka.

Double_J ::

A ni to mogoče entropija? Negativna informacija, namreč. Oz negativna entropija je informacija.

Entropija sistema je naravni logaritem števila različnih možnih porazdelitev.
Dve šivanki...

Zgodovina sprememb…

  • spremenil: Double_J ()

Kryx ::

Thomas, zanimivo, kar si napisal, izgleda enostavno, pa vendarle.. jaz se še vedno igram s tem, ne mojega pisanja razumet kot teženje, ampak pomagaj.

Definiral si sekvenca A random relativno glede sekvenco B:

> Data stream A, je random relativno glede na data stream B, kadar je korelacija med njima 0.

Potem si še definiral, kdaj je sekvenca A random relativno na zadano množico sekvenc:

> Data stream A je random relativno na vnaprej zadano množico data streamov, kadar je random na vsak njen element.

Vprašanja: Zakaj si v definiciji izbral za "primerno" funkcijo ravno korelacijo? Kako jo računaš? Kaj če si sekvenco praštevil in sodih števil interpretiraš zgolj kot sekvenci nekih simbolov, ki jih ne smeš kar seštevat pa delit med sabo?

Kakorkoli, na tem mestu je random = nekorelirano, to je "relativni" random, v bistvu je do sem izraz random čisto odveč.

Potem pride vaja:

> Je data stream random praštevil do 1000, random glede na data stream random sodih števil do 1000?

Tukaj si poleg relativnega random dodal še "absolutni" random, prvi in tretji v gornjem stavku, ki si ga naknadno pojasnil s primerom idealnega žrebanja iz klobuka.

Če vajo glede na napisano skozi svoj prevajalnik spustim, se glasi takole:

Je sekvenca praštevil do 1000 žrebanih iz klobuka KORELIRANA Z (=RANDOM GLEDE NA) stream sodih števil do 1000 žrebanih iz klobuka.


V prvem postu praviš, da (stream praštevil do 1000 iz klobuka) NI RANDOM (glede na stream sodih števil iz klobuka). Ker je med njima neničelna korelacija (ki jo mormo za vajo še izračunat).

V naslednjem postu praviš, da tok praštevil iz klobuka vendarle je (absolutno?) random, in da zanj NIMAMO koreliranega datastreama (bolje? rečeno: generatorja takšnega streama).


Tole je šele zanimivo:

> Če bi ga uspeli (delno) ugant, ker bi naprimer vedeli, da 101 notri manjka, ne bi bil več povsem random.

Vendar.. Kdo ne bi bil več povsem random. Stream praštevil do 1000? Ali stream praštevil do 1000 brez 101? Saj fora s klobukom in listkom ostane, to da še 101 mečemo nazaj "kvalitete" te metode nič ne spremeni. Zakaj potem ena daje random tok, druga pa ne. Zgolj zato, ker vam v drugem primeru "lažem", da iz klobuka praštevila letijo, jaz jih napovedujem (nikoli ne rečem 101, ker samo jaz vem, da števila vmes ni) in zaradi tega vi eno korelacijo med dejanskim in mojim napovedanim tokom zaznate? Men se zdi to bolj dejvidkoperfild8-O štos?!

:)

Thomas ::

Najprej moram povedat, da je Kryxov prispevek odličen.

Zdaj pa k razlaganju!

> Zakaj si v definiciji izbral za "primerno" funkcijo ravno korelacijo?

Lahko je korelacija. Lahko je tudi kaj drugega. Pa zberimo (najprej) najpreprostejšo možnost!

Denimo, da je v enem datastreamu verjetnost, da se pojavi A enaka p. Da se v drugem pojavi B je pa q.

Verjetnost pojavljanje A in B hkrati, ne sme presegati p*q ali biti mnogo manjše. Če ni tako, smemo sklepati na zvezo med njima. Nista popolnoma random.

Če ima stavek A==>B večjo frekvenco, kot p*q je regularity tega sistema, če ima manjšo, je negative regularity in datastreama nista več popolnoma random eden glede na deugega.

Koliko večji in koliko manjši? Bitna kompleksnost stavka mora biti manjša, kot prihranek, če bi na račun tega regularity naredili kompres datastreamov.

Potem nikakor nismo omejeni samo na sočasno pojavljanje in implikacijo enega z drugim, pač pa na kakršnokoli formulo. Le da je njena bitna kompleksnost manjša, kot prihranek pri tako narejenem kompresu.


> Kako jo rac(unaš? Kaj c(e si sekvenco praštevil in sodih števil interpretiraš zgolj kot sekvenci nekih simbolov, ki jih ne smeš kar seštevat pa delit med sabo?

Kot sem rekel, lahko delaš vse. Lahko si izmišliš kakršnokoli zapleteno formulo, pa če ti ta formula aplicirana na en niz kaj pove o drugem nizu, je to že znak, da zadevi nista random.

Pod pogojem seveda, da ti razkrije več bitov v drugem nizu če poznaš prvega, kot je sama kompleksna.



Koliko maksimalno bitov vsebuje niz 1000 števil do 1023? 10000. 10 za vsakega.

Zdej lahko potencialno uporabim vsako informacijo za zmanjševanje tega. Lahko uporabim drug niz.

Če vem da sta enaka, zelo skrčim. Če vem da sta disjunktna tudi precej. Če vem, da je eden zašiftan glede na drugega, potem je pa odšteta 7, tudi.

Če imam regularnost, ki ni prevelika v smislu Kolmogorova, niza nista random.

Je do sem vse OK?
Man muss immer generalisieren - Carl Jacobi

Zgodovina sprememb…

  • spremenil: Thomas ()

Kryx ::

Ok, če prav razumem, lahko razmišljam tudi takole:

Imamo dva niza, A in B, ter formulo f, ki (enolično) predela A. Potem lahko opazujemo F(A) in B na najpreprostejši način: z opazovanjem frekvence dogodka A in B hrati in primerjavo tega z verjetnostjo p*q. Če opazimo signifikantna odstopanja od pričakovanih vrednosti in če teh odstopanj ni mogoče upravičiti s formulo f (ker je "preveč enostavna"), potem je f regularnost med A in B, ki potemtakem nista random eden glede na drugega. ?

:)

Thomas ::

Tako je.

Regularnost ki jo opazimo, ni omejena samo na "hkratne" A in B, pač pa ima lahko kakšen starejši B vpliv na A.

To tak vpliv, ki nam prihrani več bitov, kot nam jih pravilo poje!
Man muss immer generalisieren - Carl Jacobi

Kryx ::

Dobro. Kako se glede na povedano nadaljuje zgodba s praštevili, klobuki... ?

:)

Thomas ::

Kako vem, da 10 bitna soda ševila A in 10 bitna praštevila B niso neodvsna med sabo?

Ker obstaja način, kako po dve (A in B) lahko popakiram skupaj v manj kot 20 bitov. Če je le niz obojnih dovolj dolg.

Kako?

A (sodo število) predstavim kot n-to število, ki ni enako vsem različnim B-jem doslej. B (praštevilo) pa kot m-to število, ki ni enako vsem različnim A-jem doslej.

Za A rabim 10 bitov, za B pa 9.

Kar A ne porabi (okoli 180 mest od 1024), so rezervirani za okoli 180 parov AB. B rabi torej kvečjemu 9 bitov.

Če tako formulo najdemo, si niza nista random.

OK?
Man muss immer generalisieren - Carl Jacobi

Kryx ::

S čim utemeljuješ zahtevo po 10 bitih za soda števila pod 1024? Če že izbereš binarno notacijo, je 9 bitov za 512 sodih števil (do 1024) ravno prav. Podobno je za vseh 172 praštevil manjših od 1024 8 bitov preveč.

Thomas ::

Utemeljujem s tem, da ne kodiramo niza glede na samega sebe, pač pa (v splošnem) na nekega drugega.

Če se pa da kodirati na samega sebe, kot si dal primer, pa tudi ni random.

Ampak mi smo imeli ta primer. Zanj bi lahko ponucali tudi Goldbachovo domnevo, ki do 1000 zagotovo drži. Ta povezuje soda števila s praštevili.

Mnogo takih funkcij lahko naredimo med sodimi in med praštevili. Kadar ne moremo, kadar sta zaporedji kot teflon drug za drugega, kadar niti ena povezovalna funkcija ne obstaja, potem sta random drug za drugega.
Man muss immer generalisieren - Carl Jacobi

Kryx ::

Zdej sm se pa zgubu:'( Moram priznat, da mi je zadeva nekak šokantna in kontraintuitivna.:( Dobro, ali se da to s praštevili in sodimi števili kako praktično izkoristiti? (itak pa bom o vsem skupaj še tuhtal).

:)

Thomas ::

Zdej smo obravnavali random zaporedje praštevil in sodih števil. Težje razumljiv primer.

Lahko pa obravnavamo soda števila po vrsti in praštevila po vrsti.

Iz sodega števila A, lahko izračunamo A/2 - to praštevilo. To je popolnoma izračunkjivo in lista zaporednih sodih števil + algoritem za nto praštevilo, skomprimirajo drugo sekvenco na 0.

To celo, če dobivamo soda števila po random redu, pa komplementarno praštevilo lahko izračunamo brez dodatne informacije.
Man muss immer generalisieren - Carl Jacobi

Thomas ::

So pijeve decimalke random? Ne niso, ker poznamo algoritem, ki jih kreira. Niso random proti outputu tega algoritma, pač pa so mu kar enake.

Zanimiv data stream so bile geografske zahteve, za zdravila proti atipični pljučnici, ki so prihajala v CDC v Atlanti do 1980. Popoln random, so zgledala. Potem so se clusterizirala na San Francisco - in vzrok je moral biti zadaj. AIDS med homoseksualci tam.

Je vzhajanje Sonca Random? Ni, ker poznamo en niz, ki mu je enak. Kar kažejo kazalci neke "astronomske ure" v Science Museumu v Londonu. Niz vzhodov Sonca in položaje kazalcev tiste ure, lahko povežemo s funkcijo.

So loto številke slučajne? So, ker ne poznamo niza, ki bi kazal na kakšno korelacijo z njimi. Kdo bo sicer rekel, da "je bila 11 izžrebana 2,3 krat večkrat, kot je bilo povprečje v zanjih 10 letih".

Že mogoče, toda za to povedat si porabil več bitov, kot s tem znanjem lahko komprimiramo ta file vseh izidov. So forget it!
Man muss immer generalisieren - Carl Jacobi

Zgodovina sprememb…

  • spremenil: Thomas ()

Kryx ::

Dve opombi:

1. A je/ni random glede na B in hkrati B je/ni random na A šele pomeni, da A in B sta/nista random eden glede na drugega. Lahko da velja samo prvo ali samo drugo.

2. Glede časa. Hkratne A in B ter vpliv starejših B na A smo že imeli. Dopusten pa je tudi "vpliv" novejših B na A. Torej tudi če na A vplivajo B, ki so glede na opazovani A še v prihodnosti, A ni random glede na B.

:)

Thomas ::

2. Se strinjam.

1. Niz A je random za nekega (inteligentnega) opazovalca, če ta nima nobenega algoritma, ki bi dajal tak output, ki bi koleriral z nizom A.

Kar pa ne pomeni, da je vsak niz random za vse opazovalce, da nobeden nima niza, ki kolerira z A. Nekateri prepoznamo recimo niz praštevil. Primerjamo ga z nekim algoritmom pri sebi.

Za niz števil, ki ga predstavljajo sekunde po začetnem času 0, ko je eksplodiral (vsaj) eden od 1000 radijevih atomov velja, DA NOBEN opazovalec nima niza, ki bi koleriral s tem nizom "radioaktivnih sekund".

Ta niz se bo vlekel kakih 50 tisoč let, večina od milijarde (morda dveh) sekund bodo "neradioaktivne", 1000 (najbrž ne bo v eni sekundi dveh bumov) pa jih bo, ko bo razpadel atom.

Tistih 1000 števil (ki označujejo sekunde v katerih je prišlo do razpada Ra atoma) pa ne bo predvidel noben opazovalec prav dobro. In to pomeni, da je ta niz absolutno slučajen.

Razen, če bi ga kdo. Trenutno velja, da takega ni, ni bilo in ga ne bo.
Man muss immer generalisieren - Carl Jacobi

Kryx ::

Ja, to ja (spet dobra razlaga).

Jaz sem pod 1. samo mislil, da (binarna) relacija je/ni random med nizi, kot si jo definiral, ni refleksivna. Na primer: s katerimkoli nizom lahko komprimiraš konstanten niz, obratno pa ne.

Dejansko pa je "meso" te teme v procesiranju (teh nizov). In vprašanje "true random?" pomeni, ali je v tem vesolju kakšen podsistem (kot recimo manifestacija razpada Ra atomov), čigar output za ves preostanek vesolja z vsemi računskimi kapacitetami izgleda totalno "pozipan".

:)

Thomas ::

Ja, zgleda totalno pozipan! Bellov teorem pravi, da dodaten kompres pod nobenimi pogoji ni možnen, za nobenih 1000 Ra atomov.

To je kar fascinantna trditev, ja.
Man muss immer generalisieren - Carl Jacobi
1
2
»


Vredno ogleda ...

TemaSporočilaOglediZadnje sporočilo
TemaSporočilaOglediZadnje sporočilo
»

Digitalna evolucija (strani: 1 2 3 426 27 28 29 )

Oddelek: Znanost in tehnologija
141668325 (18494) pietro
»

kako definirtati prastevilo

Oddelek: Programiranje
143430 (3235) ooux
»

Zakaj živimo?

Oddelek: Problemi človeštva
322674 (2346) Tic
»

statistika (strani: 1 2 )

Oddelek: Znanost in tehnologija
674523 (3860) Thomas
»

Praštevila

Oddelek: Znanost in tehnologija
101430 (1150) zaj_tam

Več podobnih tem