» »

Kako do podatkov čez 20-40 let?

Kako do podatkov čez 20-40 let?

1
2
»

Twix ::

Najbol za shranjevanje so primerne tračne enote/kasete..
The world is a dangerous place, not because of those who do evil,
but because of those who look on and do nothing. Apple has a patent on patent-
ing things they didn't invent. arka putana! :D hašek :D HVALA EDWARD SNOWDEN!

poweroff ::

Heh, fantje, eni prav naivno razmišljate. Bom najprej opisal svoj primer.

Pred leti so se pojavile Iomega ZIP drive enote. Take velike debele diskete, kjer si imel celih 100 Mb placa. Nora zadeva za tiste čase.

Kupil sem si par disket in prenosno enoto, ki sem jo v ruzaku nosil na faks. Gor pa čisto vse fajle, ki sem jih rabil. Tudi kolega si je kupil podobno zadevo - le da je bila enota vgradna, za v računalnik.

No, potem so prišli USB ključki... pa zamenjali smo par računalnikov... in nekega dne se kolega spomni, da ima doma še par disket, enote pa žal ne več. Je šla preč ob neki menjavi računalnika.

Hum, smola. Diskete so, bralne enote pa ne. No, ugotovila sva, da imam jaz doma prenosno enoto. Zadevo priključim na računalnik - in seveda ne dela. A, driverji! No, po krajšem zajebavanju smo zadevo uspeli usposobiti. Ampak so določeni Word dokumenti precej drugače izgledali v novejšem Wordu ali OpenOfficu kot v tisti originalni verziji Wirda v kateri so bili napisani... Da ne govorim o podatkovnih datotekah za nek software, ki smo ga uporabljali na faksu. Neznan format, software že zdavnaj izginil iz spleta. Pa je minilo manj kot 10 let.

No, potem sem se spomnil na svoj prvi prenosnik. Ki je imel zunanjo enoto za 5,25" diskete. Diskete imam še, enota je žal crknila. Kje dobit enoto... OK, varianta je Kiberpipin računalniški muzej, a doklej še.

Ali pa na Atari, ki je uporablja 3,5" diskete. Fajn zadeva, samo s PCjem je nisem uspel prebrati oz. zagnati svojega prvega programčka (za vodenje lokalne knjižnice, notri sem na roke ukucal celo celotno bazo vseh knjig).

V glavnem, problemov je kar nekaj. Od medijev, do bralnikov teh medijev, do formatov, itd.

V bistvu je edina rešitev, da si delamo backupe na vedno nove medije in v vedno nove formate (če gredo stari formati iz uporabe). Sam osebno delam backup na disk in sicer na dve ločeni lokaciji (doma in še nekam - lahko pride doma do požara, poplave,...). Pač, vsake toliko časa poženem ročni backup in zamenjam diske.

Oblak je opcija, vendar vedno samo skupaj z eno ali raje dvema fizičnima kopijama. Malokdo se zaveda, da oblak lahko na hitro izgine v stečaju... ali pa je lociran v kakšni stavbi, ki jo bo jutri zalil cunami...

V glavnem, to niso neki marginalni problemi. To so prekleto realni problemi. Ki pa ne bolijo sedaj. Tudi čez 5 let ne bodo boleli. Čez 50 let pa. In takrat zelo močno.
sudo poweroff

brodul ::

Dokler je format odprt IMO ni pene. Pri medijih se je prijel CD, na njega se spravi veliko podatkov, glede zanesljivosti pa jaz nisem imel problemov pač spečeš 3, čeprav bi se dalo pri medijih izboljšat zanesljivost.

Se pa strinjam, čim več repliciranja po večih medijih.
Pretending to be a mature adult is so exhausting.

poweroff ::

Ja, pa vsakih par let pregled in replikacija na nove uveljavljene medije.

Kar je fino, dokler imaš malo podatkov. Ko si pa arhiv in imaš nekaj omar ali nekaj hodnikov, se pa zabava neha. Pregled in replikacija na nove uveljavljene medije vsakih nekaj let ti takrat predstavlja visok strošek.
sudo poweroff

blackbfm ::

ti takrat predstavlja visok strošek

odvisno kok so ti zadeve ki jih hraniš pomembne:P

Pyr0Beast ::

Tako arhiviranje ima rešitev edinole v aktivnih medijih - katere lahko kopiraš s Ctrl+C + Ctrl+V medtodo.

Diskete in vse ostalo je ratalo obsolote.

Problem disket in podobnih zadev v velikih količinah je tudi vzdržljivost bralne enote. Meni se je enkrat zgodilo, da je floppy preprosto mrknil. V enem primeru je sproti brisal zapisano (nekje se je našel magnetni tujek, ki se je potem naselil na glavo). Podobno je pri tračnih enotah kjer ti lahko zadeva sfrtajčka celo kaseto, jo pregreje, strga ali kako drugače deformira.
Some nanoparticles are more equal than others

Good work: Any notion of sanity and critical thought is off-topic in this place

poweroff ::

blackclw - daj nehaj bluzit, no!

Če si Arhiv, ti je ta podatek še prekleto pomemben. Če si pa direktor Arhiva ti je pa pomembno, da imaš čim nižje obratovalne stroške.
sudo poweroff

jukoz ::

Mi smo za eno stranko dosti časa vložili v tole in prišli do sklepa da kakršenkoli elektronski arhiv ni dovolj. Najpomembnejše dokumente je potrebno še natisnit.

Razlaga je čist preprosta, že prej omenjeni cunami:
če ti crknejo diski gre vse - vsi podatki
če ti zalije/zagori... papirnati arhiv, vsaj nekaj ostane. Vedno vsaj nekaj ostane. Če imaš ob tem še elektronski arhiv nekje na drugi lokaciji si OK

Gregor P ::

poweroff je izjavil:

Heh, fantje, eni prav naivno razmišljate. Bom najprej opisal svoj primer.
Pred leti so se pojavile Iomega ZIP drive enote. Take velike debele diskete, kjer si imel celih 100 Mb placa. Nora zadeva za tiste čase.

Da, se spomnim teh časov; nismo kupovali teh naprav ker je bilo nekako samoumevno, da so kratkega roka8-)
The main failure in computers is usually located between keyboard and chair.
You read what you believe and you believe what you read ...
Nisam čit'o, ali osudjujem (nisem bral, a obsojam).

Pyr0Beast ::


če ti zalije/zagori... papirnati arhiv, vsaj nekaj ostane. Vedno vsaj nekaj ostane. Če imaš ob tem še elektronski arhiv nekje na drugi lokaciji si OK

Ja. Imaš en kup nesortiranih dokumentov potem. Ki do poleg tega, da so vlažni še blazno neobstojni in začno razpadati. Kmalu fašeš plesen in vse skupaj zgnije/splesni v pozabo. Če zgori, isto, samo da je zadeva sterilna.

Totalna bedarija.

Raje kot ščititi tone papirja se nabavi kompjuter rack ki je ščiten pred vodo in ognjem. Notri pa nabašeš za par 100TB diskovja.
Some nanoparticles are more equal than others

Good work: Any notion of sanity and critical thought is off-topic in this place

Phoebus ::

poweroff je izjavil:

Ja, pa vsakih par let pregled in replikacija na nove uveljavljene medije.

Kar je fino, dokler imaš malo podatkov. Ko si pa arhiv in imaš nekaj omar ali nekaj hodnikov, se pa zabava neha. Pregled in replikacija na nove uveljavljene medije vsakih nekaj let ti takrat predstavlja visok strošek.


Na roko nam gre pa dejstvo, da kapacitete medijev in moč procesiranja naraščajo.

Prvi šus, arhiviranje celega "hodnika", TRAJA.

Ko imaš enkrat zadevo primerno digitalizirano in če skrbiš za redno repliciranje (kar je, roko na srce, potrebno), lahko rednem intervalnem repliciranju v daljših intervalih menjaš tehnologijo- na večje medije (10 "kaset" namesto 100), prav tako lahko tudi menjaš (brezizgubni!) format. Torej, če si imel prvič cel hodnik, imaš drugič celo omaro.

Če si Arhiv, najbrž ne boš imel digitaliziranih nosilcev v "celem hodniku", ampak si boš omislil kaj malo bolj avtomatiziranega, naprimer tole (do 15PB):

Zgodovina sprememb…

  • spremenil: Phoebus ()

energetik ::

Tud jst mislim, da zadeva ni tako kritična. Poleg podatkov na svoji kišti, nabaviš še 2 zunanja diska in gor delaš bekape. Vsaj tako imam jaz, oz. imam 3. kopijo na DVD-jih, da sem varen pred EMP, če slučajno v bližini detonira termonuklearna konica. :) 1 kopijo imam pri starših, na drugi lokaciji. Ko pride druga tehnologija in postane zrela, prekopiraš gor vse podatke. Če je potrebno z neko skripto vsem slikam zamenjaš format. Kar pa je mogoče potrebno 1x/20 let.
Poleg tega, kot je omenil Phoebus, se kapacitete medijev stalno večajo, in imaš vedno manj dela. Na 1 DVD lahko spraviš na milijone fotk izpred 10 let, ko so bile velike po par 100kB, kaj šele na 2TB disk.

In če so ti datoteke/slike/filmi tako pomembni za spomine, boš to naučil tudi svoje potomce. Če jih pa nimaš, pol pa itak nima veze.
Če si pa paranoik, daš pa vse skupaj v takle format in 1 kopijo zakoplješ v kakšen rudnik soli, drugo pa daš odposlati v globine vesolja: Golden Record :D

Zgodovina sprememb…

  • spremenilo: energetik ()

Pyr0Beast ::


Če si Arhiv, najbrž ne boš imel digitaliziranih nosilcev v "celem hodniku", ampak si boš omislil kaj malo bolj avtomatiziranega, naprimer tole (do 15PB):

Useless ...

Sploh za digitalen arhiv. Šibka točka ti je in sam softwer ki lavfa vso zadevo in tračne enote.

Postaviš n-serverjev na katerih delaš preproste 'mirrorje'.

Če en server pade dol preprosto redirectaš URL na drugega, hkrati pa lahko furaš tudi load-balancing.

Saj je zadeva popolnoma statična in na en disk komot flikneš vse kar rabiš in postaviš 'read-only' flag.
Pa jih sortiraš tudi po letih če ti tako paše.
Some nanoparticles are more equal than others

Good work: Any notion of sanity and critical thought is off-topic in this place

BlueRunner ::

Če si Arhiv je zadeva obvladljiva. Tehnološko, cenovno in logistično, ker imaš opravka z določeno množico podatkov in procesom upravljanja s temi podatki in ustanovo, ki obstaja za to hranjenje. Tukaj je digitalna tehnika dobrodošla, največji izziv pa je sprotno zagotavljanje berljivosti formatov.

Če si fizična oseba, je problem tehnološki (katere tehnologije so za domačo rabo primerne), cenoven (za kakšno ceno se jih sploh lahko dobi) in logistične (koliko svojega časa bom posvetil urejanju arhiva, kdo in kako prevzame družinski arhiv po moji smrti).

OP je začel s problemom fizične osebe, ki še vedno ni zadovoljivo rešen.

Problemi arhiviranja v velikih podjetjih in državnih arhivih so bolj ali manj že razdelani in obvladani. Tam, kjer so se tega pač resno lotili.

Phoebus ::

BlueRunner je izjavil:

Če si Arhiv je zadeva obvladljiva. Tehnološko, cenovno in logistično, ker imaš opravka z določeno množico podatkov in procesom upravljanja s temi podatki in ustanovo, ki obstaja za to hranjenje. Tukaj je digitalna tehnika dobrodošla, največji izziv pa je sprotno zagotavljanje berljivosti formatov.

Če si fizična oseba, je problem tehnološki (katere tehnologije so za domačo rabo primerne), cenoven (za kakšno ceno se jih sploh lahko dobi) in logistične (koliko svojega časa bom posvetil urejanju arhiva, kdo in kako prevzame družinski arhiv po moji smrti).

OP je začel s problemom fizične osebe, ki še vedno ni zadovoljivo rešen.

Problemi arhiviranja v velikih podjetjih in državnih arhivih so bolj ali manj že razdelani in obvladani. Tam, kjer so se tega pač resno lotili.

Word.

Sam imam doma zadevo rešeno z Raid6 + offline storage na drugi lokaciji v obliki "prenosnih diskov". Diske je treba seveda obnavljati (notranji nonstop laufajo), je pa zadeva obvladljiva. JE pa res treba v štartu pljunit nekaj denarja za tistih nekaj diskov + extra kontroler in žrtvovati stari računalnik.

BigWhale ::

Dandanes stvari niso tako drage. V pol leta si nakupis sest diskov po 2TB. Vsak mesec das nekaj vec kot 100 EUR pa imas. 3x2TB v RAID5 je za backup storage povsem zadovoljivo.

opeter ::

Saj vse lepo in prav, ampak koliko časa ti bodo ti diski delovali? Čez nekaj let jih boš moral tako ali tako zamenjati in podatke presneti na nov nosilec podatkov. Da o tem, kar je BlueRunner napisal, sploh ne govorimo.

Tukaj je digitalna tehnika dobrodošla, največji izziv pa je sprotno zagotavljanje berljivosti formatov.
Hrabri mišek (od 2015 nova serija!) -> http://tinyurl.com/na7r54l
18. november 2011 - Umrl je Mark Hall, "oče" Hrabrega miška
RTVSLO: http://tinyurl.com/74r9n7j

Mavrik ::

Saj vse lepo in prav, ampak koliko časa ti bodo ti diski delovali? Čez nekaj let jih boš moral tako ali tako zamenjati in podatke presneti na nov nosilec podatkov. Da o tem, kar je BlueRunner napisal, sploh ne govorimo.


Zato pa imaš RAID5 polje. Ko ti en disk umre ga preprosto menjaš in to delaš dokler ni tehnologija zastarela, potem pa premakneš na nove medije in nove formate. Preverit enkrat na leto, če ti RAID array dela pa ti spet ne vzame toliko časa.
The truth is rarely pure and never simple.

Grumf ::

Samo eno podrobnost bi omenil, preden se spravite nabavljati kaksne online backup
storitve preverite kaksen je njihov upload (česar seveda ni nikjer napisanega -
npr. ponujam vam neomejeno kolicino diskovja na mojem serverju zastonj (hitrost uploada
je 1 bit / uro) ), da ne boste kleli, ko boste ugotovili, da podatkov ne morete spraviti
na njihove serverje v enem letu :)

Mavrik je izjavil:

Zato pa imaš RAID5 polje.


In potem ti crkne kontroler in ga po cistem nakljucju nikjer ne mores vec dobiti :D Glasoval
bi raje za tape, ceprav imam identicen problem, za scsi kontroler sem driverje se nekako (s
tezko muko) zbrskal, za tape device pa jih ne dobim.

Zgodovina sprememb…

  • spremenil: Grumf ()

Lonsarg ::

Kakšen RAID5, bedarija za arhiv, tak raid je za aktivne data centre. Za backup ne rabiš, da ti v primeru failure podatki takoj naprejd ostopni, ti rabiš, da so na varnem.

To pa dosežeš z Miror raid. Torej vsak disk je poleg v miror raidu sposoben komot delati tudi kot samostojen disk. Najbolj zanesljivo. Več na eni sami lokaciji je brez veze. Samo več diskov v raidu ne naredi nič, več lokacij treba.

Grumf ::

Jap.

poweroff ::

Glede kontrolerja vprašajte Primoža kako je zabavno, ko firmi crkne RAID 50 kontroler. Proizvajalec pa reče, da novega ni mogoče dobiti...
sudo poweroff

BigWhale ::

Zato pa imamo raid implementiran v jedru linuxa. Vazno je, da imas vsaj tri naprave, ki so "block devices" in jih das v raid5 polje. Lahko tudi raid1, ce so v raid1 je tudi vsaka naprava zase samostojna in deluje brez vzpostavljenega raid polja.

Raid5 pa zato, da imas tak raid lahko stalno dostopen, v njem pa tri naprave iz razlicnih proizvodnih serij ali celo proizvajalcev. Da se izognes IBM DeathStar problemom.

Mavrik ::


In potem ti crkne kontroler in ga po cistem nakljucju nikjer ne mores vec dobiti :D Glasoval
bi raje za tape, ceprav imam identicen problem, za scsi kontroler sem driverje se nekako (s
tezko muko) zbrskal, za tape device pa jih ne dobim.


Očitno za "dm-raid" na linuxu, ki je neodvisen od hardwara spodaj še nisi slišal :)

Kakšen RAID5, bedarija za arhiv, tak raid je za aktivne data centre. Za backup ne rabiš, da ti v primeru failure podatki takoj naprejd ostopni, ti rabiš, da so na varnem.


Razen tiste malenkosti, ko ti ti crkne lih backup disk. RAID5 je dober tradeoff kar se tiče prostora vs. varnosti - če ti trije diski v škatli ležijo v omari in ti en odpove, ti še vedno vzame _malo_ časa, da popraviš napako ko preverjaš stanje backupov. Obenem si s dm-raid precej varen pred propadanjem firm, ki bi ti sabo vzele tvoje tape kontrolerje in umiranjem tape kaset.

To pa dosežeš z Miror raid. Torej vsak disk je poleg v miror raidu sposoben komot delati tudi kot samostojen disk. Najbolj zanesljivo.


Isto zanesljivo in večja potrata prostora kot 5.
The truth is rarely pure and never simple.

SasoS ::

dm-raid != md-raid. Eno dela z raid kontrolerji, drugo je popoloma softwarska rešitev. In ja, R5 je v tem primeru IMHO precej bolje od R1.

Pyr0Beast ::

Mirror serverje daš pa po vseh večjih fakultetah in šolah.

Konec koncev. Stlačit 10TB diskov v kišto ni danes praktično noben problem. In vprašanje je če je celoten arhiv težek 10TB.

In z razporeditvijo na ostale šole si se rešil največje zagate-crkljota glavnega omrežja ali požara v server sobi. Enako pa distribuiraš tudi obremenitev linije.

Rezervne diske dobiš pa v vsaki računalniški trgovini.

Konec koncev jih lahko nabašeš več noter ter zapolniš vse prostore in ko en crkne ga preprosto Un-mountaš in furaš zadevo z malenkost manjšo redunanco dalje. Najmanjši problem.
Some nanoparticles are more equal than others

Good work: Any notion of sanity and critical thought is off-topic in this place
1
2
»


Vredno ogleda ...

TemaSporočilaOglediZadnje sporočilo
TemaSporočilaOglediZadnje sporočilo
»

Format diska za max kompatibilnost

Oddelek: Pomoč in nasveti
161676 (1287) opeter
»

Bi rajši profi slike ali vam zadošča DM, Hofer...

Oddelek: Loža
4910929 (9332) jype
»

Sony predstavil nov sistem za zapisovanje podatkov na optične enote (strani: 1 2 )

Oddelek: Novice / Optične enote / mediji
8013853 (10847) BigWhale
»

Nova anketa: je DVD/Blu ray enota (že) odveč? (strani: 1 2 3 )

Oddelek: Novice / Ostalo
10027836 (25308) kuglvinkl
»

Življenska doba podatkov na DVD-jih

Oddelek: Pomoč in nasveti
142081 (2081) Kekec

Več podobnih tem