» »

Kompresija s pomočjo /dev/random

Kompresija s pomočjo /dev/random

«
1
2

Mavrik ::

The truth is rarely pure and never simple.

Mipe ::

Kmalu* bo cela trilogija LOTR zajeta v desetih kilobajtih...

*V nekaj stoletjih

Zgodovina sprememb…

  • premaknil od: Mavrik ()

Afo ::

Mipe je izjavil:

Kmalu* bo cela trilogija LOTR zajeta v desetih kilobajtih...

*V nekaj stoletjih

Za to sploh ni treba nekaj stoletij:
"Spišeš kodek", ki je narejen samo za prikazovanje LOTR trilogije. Potem pa po netu pošlješ en bit podatkov: če je 1 ga prikaže, če 0 ga ne.
Slabost je samo v tem, da moraš imet cel LOTR pri sebi na računalniku, prednost pa potreben zelo nizek bandwidth :D
Bolje biti mlad in neumen, kot samo neumen!

Zgodovina sprememb…

  • premaknil od: Mavrik ()

jype ::

Riot77> "Spišeš kodek", ki je narejen samo za prikazovanje LOTR trilogije. Potem pa po netu pošlješ en bit podatkov: če je 1 ga prikaže, če 0 ga ne.

Komot napišeš tudi takega, ki deluje za poljubno vsebino: Pošlješ par dovolj kompleksnih rezultatov zgostitvenih funkcij in dolžino dekompresiranega niza, potem pa na cilju bereš /dev/random dokler se ti rezultat ne ujema (in imaš zelo verjetno točno pravo zaporedje bitov).

Zgodovina sprememb…

  • premaknil od: Mavrik ()

Bistri007 ::

jype je izjavil:

Komot napišeš tudi takega, ki deluje za poljubno vsebino: Pošlješ par dovolj kompleksnih rezultatov zgostitvenih funkcij in dolžino dekompresiranega niza, potem pa na cilju bereš /dev/random dokler se ti rezultat ne ujema (in imaš zelo verjetno točno pravo zaporedje bitov).

Samo moraš vedeti, da se random podatkov ne da kompresirati.

Glej: The Enduring Challenge of Compressing Random Data - http://www.drdobbs.com/architecture-and...
Največja napaka desetletja je bila narejena 4. novembra 2008
Oni so goljufali in Alah je goljufal, Alah je najboljši prevarant. (Koran 3:54)
Citiraj svetega očeta Benedikta XVI. in postani "persona rudis"...

Zgodovina sprememb…

  • premaknil od: Mavrik ()

jype ::

Sej jih nič ne kompresiraš. Bom poskusil prevest iz slovenščine v nekaj, kar boste razumeli:

Izračunaš npr. sha-3, whirlpool in morda še ripemd-320, pošlješ te tri vrednosti in velikost na cilj, tam pa računalnik bere svoj /dev/random toliko časa, da ven prebere vrednost, ki je enako dolga in s temi tremi hashi vrne enake tri vrednosti.

Edini praktičen problem je časovna zahtevnost dekompresiranja (zaradi očitne neuporabnosti kakršnihkoli pseudoroandom generatorjev).

Zgodovina sprememb…

  • premaknil od: Mavrik ()

MrStein ::

jype je izjavil:

Riot77> "Spišeš kodek", ki je narejen samo za prikazovanje LOTR trilogije. Potem pa po netu pošlješ en bit podatkov: če je 1 ga prikaže, če 0 ga ne.

Komot napišeš tudi takega, ki deluje za poljubno vsebino: Pošlješ par dovolj kompleksnih rezultatov zgostitvenih funkcij in dolžino dekompresiranega niza, potem pa na cilju bereš /dev/random dokler se ti rezultat ne ujema (in imaš zelo verjetno točno pravo zaporedje bitov).

Ne deluje.
"Osnovna" matematika.

V bistvu ista logika, zakaj random podatkov ni mogoč kompresirati.
Motiti se je človeško.
Motiti se pogosto je neumno.
Vztrajati pri zmoti je... oh, pozdravljen!

Zgodovina sprememb…

  • premaknil od: Mavrik ()

BaToCarx ::

HaHA koliko časa že nisem slišal tistega dev/random heca. Deluje ne skrbet, samo časovno ni, umm kako bi rekel, "uporabno"

Zgodovina sprememb…

  • premaknil od: Mavrik ()

Bistri007 ::

jype je izjavil:

Izračunaš npr. sha-3, whirlpool in morda še ripemd-320, pošlješ te tri vrednosti in velikost na cilj, tam pa računalnik bere svoj /dev/random toliko časa, da ven prebere vrednost, ki je enako dolga in s temi tremi hashi vrne enake tri vrednosti.

Edini praktičen problem je časovna zahtevnost dekompresiranja (zaradi očitne neuporabnosti kakršnihkoli pseudoroandom generatorjev).

Kaj pa kolizije? ShaX praktično označuje unikatno podatke, ker je verjetnost nenamenske kolizije zelo majhna. V resnici pa ne moreš z 20 bajti enoznačno označiti 20gb...
Največja napaka desetletja je bila narejena 4. novembra 2008
Oni so goljufali in Alah je goljufal, Alah je najboljši prevarant. (Koran 3:54)
Citiraj svetega očeta Benedikta XVI. in postani "persona rudis"...

Zgodovina sprememb…

  • premaknil od: Mavrik ()

Bistri007 ::

Heh, če ti je lažje, si namesto shaX predstavljaj običajno 20 bajtno vsoto. Koliko 1kb datotek ima to vsoto? Koliko 20gb datotek ima tako vsoto?

Pri shaX je težje poiskati kolizijo, ker je to kombinacija seštevanja in množenja, ampak to ne pomeni, da je kolizij kaj manj kot pri preprostem CRC.
Največja napaka desetletja je bila narejena 4. novembra 2008
Oni so goljufali in Alah je goljufal, Alah je najboljši prevarant. (Koran 3:54)
Citiraj svetega očeta Benedikta XVI. in postani "persona rudis"...

Zgodovina sprememb…

  • premaknil od: Mavrik ()

BaToCarx ::

Hihi, saj je rekel da ni pseudo random "dev/random" je true random generator. Milkiwaya ni več preden boš 1 hash match dobil....

Zgodovina sprememb…

  • premaknil od: Mavrik ()

Bistri007 ::

Saj Ivy Bridge ima strojni rnd z izvorom entropije: RdRand @ Wikipedia

Samo kako to karkoli spremeni?
Največja napaka desetletja je bila narejena 4. novembra 2008
Oni so goljufali in Alah je goljufal, Alah je najboljši prevarant. (Koran 3:54)
Citiraj svetega očeta Benedikta XVI. in postani "persona rudis"...

Zgodovina sprememb…

  • premaknil od: Mavrik ()

BaToCarx ::

Lej kar je jype rekel je pojeb že v bistvu... se ti ni treba matrat razumet.

Big Bang (random start) -> time + hash (atomčki pa tko) -> vse (mi)

Ti je lažje?

Zgodovina sprememb…

  • premaknil od: Mavrik ()

Lonsarg ::

Jao, sem šel že računat, koliko računske moči za koliko stiskanja, pol sem pa končno porajtal, da se to NE da zaradi kolizije ja.....

Nima veze true random. Enostavno je v 21 bitih za faktor dve več dve kombinacij, kot v 20 bitih, torej se vsak hash(bilokateri) v povprečju pojavi dvakrat.

Če imaš pa recimo 30bitov dolg podatek z 20bitnim hashom(~33% stiskanje) potem imaš v povprečju 2^10krat vsak hash. Torej ne deluje zadeva. Bi delovala, če bi 2^10 ali več različnih hasov dal notri(MD5,SHA-1,...) sam potem nisi nič prostora izgubil, pač pa pridobil...

Zgodovina sprememb…

  • premaknil od: Mavrik ()

BaToCarx ::

Pozabil si da je povedal eksaktno dolžino... nazaj računat :P

Pa še vse tri hase mora matchat. :D

offtopic: Me je nasmejal kolk se matrate z tem.

Zgodovina sprememb…

  • premaknil od: Mavrik ()

jype ::

MrStein> "Osnovna" matematika.

Nekje si se zmotil (sicer ne obstajaš).

Zgodovina sprememb…

  • premaknil od: Mavrik ()

Lonsarg ::

Jah, je mal problem, če imaš v glavi celo življenje predpostavko, da HASH funkcija 100% uunikatno označi katerikoli file.:)

Zgodovina sprememb…

  • premaknil od: Mavrik ()

BaToCarx ::

Še večji problem je če ne vidiš take pasti takoj. :P

Zgodovina sprememb…

  • premaknil od: Mavrik ()

jype ::

Azgard> Jah, je mal problem, če imaš v glavi celo življenje predpostavko, da HASH funkcija 100% uunikatno označi katerikoli file.:)

Sej zato maš tri, pa potem še magic na začetku fajla.

Če zračunaš verjetnosti, prideš do povsem znosnih vrednosti, do določene količine napak pa prihaja v vsakem primeru.

Zgodovina sprememb…

  • premaknil od: Mavrik ()

Lonsarg ::

Številko napak bo večje od prišparanega prostora, torej boš v najbolšem primeru, če boš imel ekstremno srečo stisnil na tak način, da boš enostavno odstranil veliko zadev.

Zgodovina sprememb…

  • premaknil od: Mavrik ()

Lonsarg ::

Kompresija je pri video nadpomenka za vse metode, tako dejansko stiskanje, kot za odstranitev določenih informacij(manj pomembnih) iz filma. Ampak pri random generatorju bi odstranil random informacije in bi bil rezultat jao slab:)

Zgodovina sprememb…

  • premaknil od: Mavrik ()

jype ::

Saj se da izračunat, kolk različnih enako dolgih bitnih nizov ustreza isti vrednosti treh znatno različnih zgoščevalnih funkcij (ki se začnejo z video glavo, na primer).

Zgodovina sprememb…

  • premaknil od: Mavrik ()

BaToCarx ::

Predam se, ker si ne znaš ponovit korake v glavi in razumet za kaj se sploh gre.
Btw Player ti tudi nebi predvajal če je narobe pa kolision..

Zgodovina sprememb…

  • premaknil od: Mavrik ()

Lonsarg ::

jype je izjavil:

Saj se da izračunat, kolk različnih enako dolgih bitnih nizov ustreza isti vrednosti treh znatno različnih zgoščevalnih funkcij (ki se začnejo z video glavo, na primer).


Se da ja:

Lonsarg je izjavil:


Če imaš pa recimo 30bitov dolg podatek z 20bitnim hashom(~33% stiskanje) potem imaš v povprečju 2^10krat vsak hash. Torej ne deluje zadeva. Bi delovala, če bi 2^10 ali več različnih hasov dal notri(MD5,SHA-1,...) sam potem nisi nič prostora izgubil, pač pa pridobil...


Potreboval bi 2^10 hash funkcij, ki so VEDNO različne in to pri 30 bitih dolgemu podatku, kaj šele pri 10000000 bit dolgemu podatku...

Zgodovina sprememb…

  • premaknil od: Mavrik ()

jype ::

Azgard> Potreboval bi 2^10 hash funkcij, ki so VEDNO različne in to pri 30 bitih dolgemu podatku, kaj šele pri 10000000 bit dolgemu podatku...

Nisi upošteval niti preseka, niti fiksne dolžine. Oboje znatno zmanjša prostor, ki ga imaš za napake.

Zgodovina sprememb…

  • premaknil od: Mavrik ()

Lonsarg ::

Ja, pa naj zmanjša, to ni bil point... ne kapiraš. Za zapis n podatkov rabiš n podatkov, pa tut če magijo izvajaš. Z x bitom hashom in n bitom podatkov lahko zapišeš x+n bitov podatkov.

Zgodovina sprememb…

  • premaknil od: Mavrik ()

jype ::

Z metersko palico lahko zapišeš vse bite v vesolju.

Zgodovina sprememb…

  • premaknil od: Mavrik ()

Voluharr ::

...dokler ne ugotoviš, da le te tudi enkrat zmanjka.
Backup, VPS, kolokacija: https://reavisys.si

Zgodovina sprememb…

  • premaknil od: Mavrik ()

Bistri007 ::

Lonsarg je izjavil:

Jah, je mal problem, če imaš v glavi celo življenje predpostavko, da HASH funkcija 100% uunikatno označi katerikoli file.:)

Hja, mene so pri matematičnem krožku v šoli naučili Dirichletov princip.

Pigeonhole principle @ Wikipedia

Pač, če imaš 9 kletk in 10 ptičev, in če so vsi ptiči v kletkah --- potem sta vsaj v eni kletki dva ali več.

Če imaš 1000-mestne podatke in 20-mestno "unikatno" oznako, kaj boš? Z 20-mestno unikatno oznako lahko unikatno zapišeš samo 20 mest. Kar je več, pa prihaja do podvajanj.

Tudi če bi dali kot pogoj, da mora biti rezultat veljavna MPEG datoteka, brez napak (kockanja), bi se zagotovo zgodilo več kolizij, ki bi tudi dale kot rezultat veljavno MPEG datoteko, vendar ne to, katero ti misliš.
Največja napaka desetletja je bila narejena 4. novembra 2008
Oni so goljufali in Alah je goljufal, Alah je najboljši prevarant. (Koran 3:54)
Citiraj svetega očeta Benedikta XVI. in postani "persona rudis"...

Zgodovina sprememb…

  • premaknil od: Mavrik ()

jype ::

Bistri007> Pač, če imaš 9 kletk in 10 ptičev, in če so vsi ptiči v kletkah --- potem sta vsaj v eni kletki dva ali več.

In imaš devet različnih možnosti. Če pa lahko te ptiče v kletke zložiš na samo tri različne načine, imaš pa še manj različnih možnosti. Če veš še, da ne moreta biti dva ptiča v prvih treh kletkah, je teh še manj.

Prej ali slej prideš do tega, da je možnosti dovolj malo, da so kolizije manj pogoste kot bitne napake - le da je pri bitni napaki stvar običajno obvladljiva, pri zgoraj opisani shemi pa rezultat popolnoma neuporaben.

Zgodovina sprememb…

  • premaknil od: Mavrik ()

Lonsarg ::

Pač nisi človek za logiko, sprijazn se, saj 95%+ prebivalstva ni.

Kar se pa tiče dodajanje omejitev pa vsako dodajanje omejitev poleg manjšanja možnosti hkrati tudi poveča velikost podatkov(oziroma zmanjša količina informacij, odvisno kako se zadeve lotiš) in nisi naredil nič.

Zgodovina sprememb…

  • premaknil od: Mavrik ()

jype ::

Azgard> Kar se pa tiče dodajanje omejitev pa vsako dodajanje omejitev poleg manjšanja možnosti hkrati tudi poveča velikost podatkov(oziroma zmanjša količina informacij, odvisno kako se zadeve lotiš) in nisi naredil nič.

Ne razumeš. Imaš prostor možnih rezultatov, ki je omejen z dosegi teh zgoščevalnih funkcij. Ker so različne, moraš deliti, ne odštevati z njihovimi velikostmi, poleg tega pa moraš zadostiti še pogojem, ki so znani vnaprej (in sicer so podatki, a jih ni treba prenašati), ker gre za znano vrsto in obliko podatkov.

Zgodovina sprememb…

  • premaknil od: Mavrik ()

Lonsarg ::

jype je izjavil:

Azgard>
Ne razumeš. Imaš prostor možnih rezultatov, ki je omejen z dosegi teh zgoščevalnih funkcij. Ker so različne, moraš deliti, ne odštevati z njihovimi velikostmi, poleg tega pa moraš zadostiti še pogojem, ki so znani vnaprej (in sicer so podatki, a jih ni treba prenašati), ker gre za znano vrsto in obliko podatkov.


Če se pogovarjamo o bitih potem lahko seštevaš odštevaš, ker je vsak bit neka potenca števila 2. Če pa se pogovarjamo o številkah, potem pa ja, moraš množiti in deliti, samo številke ne povejo velikosti datoteke, biti jo.

8 kletk=2^3, kar so 3 biti.

Zdaj pa če pač dodaš eno omejitev, ki preseka število možnosti za dve moraš res deliti, torej 8/2 = 4, kar sta 2 bita(2^2). Torej komot bi tudi odštel 1 bit. Smo pa mogli tut 1 bit informacije dodati, da smo povedali, za kakšno omejitev gre, torej smo še vedno ostali pri 3 bitih.

Bolš skor ne znam razložiti.

Zgodovina sprememb…

  • premaknil od: Mavrik ()

Bistri007 ::

jype je izjavil:

Ne razumeš. Imaš prostor možnih rezultatov, ki je omejen z dosegi teh zgoščevalnih funkcij. Ker so različne, moraš deliti, ne odštevati z njihovimi velikostmi, poleg tega pa moraš zadostiti še pogojem, ki so znani vnaprej (in sicer so podatki, a jih ni treba prenašati), ker gre za znano vrsto in obliko podatkov.

Recimo, da tvoje 3 zgoščevalne funkcije in velikost datoteke imenuješ jype_hash (JH), katerega rezultat je 64 bajtov.

Če bi zgostil vse različne 100 bajtne datoteke, bi imel milijarde milijard kolizij.

Sam sem prej omenil, da bi bil lahko eden izmed pogojev veljavna MPEG datoteka. Ampak v teh milijardah milijard različnih možnosti se najde tudi vsaj več milijonov veljavnih MPEG datotek.

Če gremo na megabajtne velikosti ali celo gigabajtne filme, potem pa sploh. Si predstavljaš, koliko je 2^1.000.000 ali 2^1.000.000.000?

Izračun:
64 bajtov je 512 bitov
Pri 2^1.000.000 imaš s tem hashem 2^999.488 kolizij
Pri 2^1.000.000.000 imaš s tem hashem 2^999.999.488 kolizij

Teh 512 bitov je pri velikostih, običajnih za video datoteke, pljunek v morje. Lahko bi pretvoril v desetiški sistem (logaritmi), ampak rezultat je isti.
Največja napaka desetletja je bila narejena 4. novembra 2008
Oni so goljufali in Alah je goljufal, Alah je najboljši prevarant. (Koran 3:54)
Citiraj svetega očeta Benedikta XVI. in postani "persona rudis"...

Zgodovina sprememb…

  • premaknil od: Mavrik ()

jype ::

Bistri007> Teh 512 bitov je pri velikostih, običajnih za video datoteke, pljunek v morje. Lahko bi pretvoril v desetiški sistem (logaritmi), ampak rezultat je isti.

Ne, ni.

Pravzaprav bi dobil le majhno naravno število kolizij, ampak da bi to razumel, moraš najprej prebrati, kaj sem zapisal zgoraj.

Zgodovina sprememb…

  • premaknil od: Mavrik ()

Bistri007 ::

jype je izjavil:

Ne, ni.

To ni ravno neki argument. Razen če misliš, da gre za argument avtoritete :D

Glej, 2^512 je gromna cifra, 1/2^512 pa zelo majhna.
Ampak 2^milijon ali 2^milijardo pa je za nekaj razredov velikost večja.

Če ti je lažje:
2^512 si predstavljaj kot dvomestno število, npr. 99
2^milijon si predstavljaj kot štirimestno število, npr. 9999

Kako misliš vsa štirimestna števila (9999) enoznačno "identificirati" zgolj z dvomestnim število (99) - oziroma dvomestnim naslovnim prostorom???

In ja, velikost datoteke je del parametra, drugače bi vzel v obzir še vsa 5-, 6-, 7- 8- itd mestna števila.

Dirichletov princip - Pigeonhole principle @ Wikipedia
Največja napaka desetletja je bila narejena 4. novembra 2008
Oni so goljufali in Alah je goljufal, Alah je najboljši prevarant. (Koran 3:54)
Citiraj svetega očeta Benedikta XVI. in postani "persona rudis"...

jype ::

Bistri007> Dirichletov princip - Pigeonhole principle @ Wikipedia

Pigeonhole principle nima tako intuitivnih posledic za rigidno strukturirane podatke, kakršni so video zapisi.

Bistri007> Kako misliš vsa štirimestna števila (9999) enoznačno "identificirati" zgolj z dvomestnim število (99) - oziroma dvomestnim naslovnim prostorom???

Ne moreš, ampak veljavnih zapisov je znatno manj kot "vsa štirimestna števila" oziroma komaj kaj.

Bistri007 ::

jype je izjavil:

Ne moreš, ampak veljavnih zapisov je znatno manj kot "vsa štirimestna števila" oziroma komaj kaj.

Koliko je to po tvojem znatno manj? Torej, kolikšna je verjetnost, da ima 1GB video datoteka pokvarjen en bit, pa še vedno gre čez vsa CRC preverjanja, ki jih naredi video dekoder?
Največja napaka desetletja je bila narejena 4. novembra 2008
Oni so goljufali in Alah je goljufal, Alah je najboljši prevarant. (Koran 3:54)
Citiraj svetega očeta Benedikta XVI. in postani "persona rudis"...

Lonsarg ::

Tudi če narediš najbolšo možno umetno inteligenco, ki ve kak približno mora film zgledaz z kvantnim računalnikom za hardware je ŠE VEDNO preveč pravih videov. Igralec bo dal v usta bonbom, in veliko različnih odtenkov(praktično neskončno) za barvo so vsi "pravi". Že samo en sam bombon v celem videu ima več možnih kombinacij, kot jih lahko pokriješ z eno armijo hashov.

Sploh pa mi smo tole debato načeli z dilemo o računski moči in ne pametnemu softwaru, ampak kot vidiš, tudi če bi ga imeli ne gre to skozi.

jype ::

Bistri007> Torej, kolikšna je verjetnost, da ima 1GB video datoteka pokvarjen en bit, pa še vedno gre čez vsa CRC preverjanja, ki jih naredi video dekoder?

Če je CRC, potem ogromno. Če je kaj zapletenejšega, potem znatno manj.

Azgard> je ŠE VEDNO preveč pravih videov.

Ni jih preveč, ker biti med seboj še zdaleč niso neodvisni.

Azgard> načeli z dilemo o računski moči

Ja, ampak moj point ni bil, da lahko karkoli zapišeš kot en hash, ampak da lahko video zapis zapišeš kot tri med seboj neodvisne hashe (in imaš možnosti, da ko imaš ustrezajočo veljavno strukturo, tudi video ustreza).

Zgodovina sprememb…

  • spremenilo: jype ()

Bistri007 ::

Lonsarg je izjavil:

Sploh pa mi smo tole debato načeli z dilemo o računski moči in ne pametnemu softwaru, ampak kot vidiš, tudi če bi ga imeli ne gre to skozi.

Azgard, jypa se očitno ne da prepričati. Ampak Dirichletov princip je zakon množice.

Primer:
Imaš npr. 100MB datoteko, tj. 800 milijonov bitov.
- imaš 2^800.000.000 različnih datotek.
- 512-bitnih hashev imaš različnih "samo" 2^512.

Ne me narobe razumeti, ampak 2^512 je ogromna cifra, 1/2^512 pa zelo majhna. Ampak nesignifikantna v primerjavi z 2^800.000.000.

Vsak izmed 512-bitnih hashev ima 2^799.999.488 kolizij. Če npr. rečeš, da je veljavna video datoteka samo vsaka na milijardo milijard, tj vsaka na 2^60 (zelo konzervativno gledano).
Ampak tudi s tem imaš 2^799.999.428 veljavnih video datotek velikosti točno 100MB za vsaki tvoj jype hash.
Največja napaka desetletja je bila narejena 4. novembra 2008
Oni so goljufali in Alah je goljufal, Alah je najboljši prevarant. (Koran 3:54)
Citiraj svetega očeta Benedikta XVI. in postani "persona rudis"...

Bistri007 ::

EDIT:

jype je izjavil:

Ja, ampak moj point ni bil, da lahko karkoli zapišeš kot en hash, ampak da lahko video zapis zapišeš kot tri med seboj neodvisne hashe (in imaš možnosti, da ko imaš ustrezajočo veljavno strukturo, tudi video ustreza).

Ajde, naj bo po tvoje. Povej točno koliko bitov potrebuješ za:
- velikost datoteke
- hash 1
- hash 2
- hash 3

Kolikšna je po tvojem verjetnost, da dobiš veljavno 100MB video datoteko s pokvarjenim enim bitom. Oceno prosim.
Največja napaka desetletja je bila narejena 4. novembra 2008
Oni so goljufali in Alah je goljufal, Alah je najboljši prevarant. (Koran 3:54)
Citiraj svetega očeta Benedikta XVI. in postani "persona rudis"...

jype ::

Bistri007> Kolikšna je po tvojem verjetnost, da dobiš veljavno 100MB video datoteko s pokvarjenim enim bitom. Oceno prosim.

Odvisno od zapisa med približno 1/2^10 do 1/2^120 (odvisno predvsem od mehanizmov, ki jih uporablja za odpravo napak).

BaToCarx ::

Lahko dam jst moj primer, ka vidim da se vam da računat?

Imamo format video zapisa .bato , ima dolečeno striktno vse kar je noter, je raw format za sliko uporablja 64 bit za (RGB) 120 fps ter uporablja točno zaporedje pixslov v enem frejmu 4K, ki se matematično premikajo na "nerandom" način ( pixel 0,0 v frame 1 je v fajlu na pozicij 0,0 , pixel 0,0 v frame 2 je pa na poziciji 231,666, itd..) za vsakim frame je reedsolomon za prejšnih 10 in naslednjih deset frameov, Vsakih 120 frame je redsolomon za prejšnih 120 ter naseldnjih 120 redsolomonov. Dekoder v primeru nepoprvaljive napake izračuna vmesne slike. Torej pravila so "jasna".

random je kot pipca 0 in 1, to se strinjamo? Torej ko dobimo prvi naliv ki je pravilne velikosti uporabimo CRC32, če je match še SHA-512, če je match še Whirpool, če je match predvajamo. Gut? Če ga ni se prvi 0 ali 1 odstrani in doda naslednji 0 ali 1. Ad infinitum...

Z vsemi kolizijami in pojebi, še vedno dobimo več dobrih pixlov kot z kakršnokoli lossy kompresijo. Ker nas čas ne briga, nas ne briga tudi velikost zato poknemo en par petabajtov (ali kot se nam zdi potrebno, za prihodnje "rodove" XD) z vso zgodbo sveta v moving pix je to zmaga, je pa dumb 100%.

*nerandom = beri wiki ali random.org kako določajo kaj je random kaj pa ne.

Se motim in kje?

Jst ::

"Deja-vu." Točno takšno debato smo imeli na IRCu okoli 2000, potem je pa nastal tisti challange če komu uspe stisniti random fajl datoteko.

Ampak to ni random. Imamo točno določeno strukturo in če bi spisali posebno hash funkcijo, ki bi upoštevala točno te karakteristike, je možno, da bi iz hasha lahko ugotovil pravo datoteko - sploh če imaš še pseudo-pseudo-random, ki tudi upošteva karakteristike originalne datoteke. Vendar bi najbrž porabili kakšno galaksijo materiala za dokaz/ovržitev, če bi to reševali z raw computingom.

Če komu uspe, je naredil velik korak k miljonu dolarjev - P=NP millennium prize.
Islam is not about "I'm right, you're wrong," but "I'm right, you're dead!"
-Wole Soyinka, Literature Nobelist
|-|-|-|-|Proton decay is a tax on existence.|-|-|-|-|

Gemm ::

Upam da to ni preveč offtopic,..
Če koga zanima kako te stvari dejansko delujejo in so uporabne za kompresijo podatkov, priporočam da naj si prebere kaj o "Compressive sensing". Vsa filozofija temelji na tem, da če je signal kompresibilen (se ga v teoriji da opisati z relativno malo koeficienti v transformiranem prostoru), potem obstaja nek postopek rekonstrukcije.

Hash funkcije ki jih tu uporabljate tu niso pretirano praktične, ker nimajo lepega inverznega transforma.

(Zakaj ima to vezo z /dev/random: tu se precej uporabljajo naključne matrice, ki so precej uporabna ortogonalna baza za opis podatkov z manj-dimenzionalnim zapisom)

Compressed sensing @ Wikipedia
http://dsp.rice.edu/files/cs/baraniukCS...
http://dsp.rice.edu/research/compressiv...

To precej s pridom uporabljam za razne data mining zadeve, ker se z njimi da dobiti zelo dobre aproksimacije podatkov, ki malo zasedejo, ampak so kvantitativno dovolj dobre. To je tudi en tak 'big data' mehanizem, da si lahko zmanjšaš problem - vsaka dobra implementacija compressed sensinga pomeni da se je nekdo uspešno izognil nakupa hadoop clusterja :)

jype ::

Jst> če bi spisali posebno hash funkcijo, ki bi upoštevala točno te karakteristike, je možno, da bi iz hasha lahko ugotovil pravo datoteko

Ja, to je ekstremen primer tega. Hash funkcija, ki iz vsakega filma pridela enoznačen niz.

Potem bi z dovolj računske moči končno lahko gledali filme, še preden jih posnamejo, like they did in Spaceballs!

Gemm> Upam da to ni preveč offtopic,..

Niti ne, ampak saj teorija je jasna, prepir je samo o tem, skozi kako kompleksen okvir še lahko stlačiš kose naključno zgrajenega modela. Če je okvir dovolj zapleten (recimo toliko, kot sta h264 in DTS uokvirjena v matroško), zelo malo (v primerjavi z vsemi možnimi - če dovolj malo, da postane uporabno, pa se verjetno nikomur ni ljubilo izračunati).

driver_x ::

jype je izjavil:

Riot77> "Spišeš kodek", ki je narejen samo za prikazovanje LOTR trilogije. Potem pa po netu pošlješ en bit podatkov: če je 1 ga prikaže, če 0 ga ne.

Komot napišeš tudi takega, ki deluje za poljubno vsebino: Pošlješ par dovolj kompleksnih rezultatov zgostitvenih funkcij in dolžino dekompresiranega niza, potem pa na cilju bereš /dev/random dokler se ti rezultat ne ujema (in imaš zelo verjetno točno pravo zaporedje bitov).


Sem probal, pa mi Cray Titan v kleti še sedaj nekaj melje.

jype ::

sammy73> Sem probal, pa mi Cray Titan v kleti še sedaj nekaj melje.

A si ponesreč turbo izklopu?

Jst ::

sammy: če se mi poleti pokvari klima, se lahko pridem hladiti v tvojo klet?


--

>Potem bi z dovolj računske moči končno lahko gledali filme, še preden jih posnamejo,

Če bi pseudo-pseudorandom generator generiral frejme, ne rabiš veliko računske moči. Kaj bi pa gledal, je pa drugo vprašanje.
Islam is not about "I'm right, you're wrong," but "I'm right, you're dead!"
-Wole Soyinka, Literature Nobelist
|-|-|-|-|Proton decay is a tax on existence.|-|-|-|-|
«
1
2


Vredno ogleda ...

TemaSporočilaOglediZadnje sporočilo
TemaSporočilaOglediZadnje sporočilo
»

Izračunana uspešna kolizija nad SHA-1

Oddelek: Novice / Varnost
189514 (7217) matijadmin
»

[Java] Kako izračunati hash diska.

Oddelek: Programiranje
335239 (4069) kunigunda
»

online davčne blagajne - plagiat hrvaških?

Oddelek: Loža
2310305 (8855) Matako
»

SHA1 hash - prevod

Oddelek: Programiranje
104226 (3883) darkolord
»

Zgostitveni algoritem SHA-0 razbit

Oddelek: Novice / Varnost
254276 (4276) darkolord

Več podobnih tem