Digitale duurzaamheid
Van Wikipedia
Digitale duurzaamheid is het groeiende probleem van de duurzaamheid van digitale data. Vooral in de beginjaren van de informatica dacht men nauwelijks na over de vraag hoe digitaal opgeslagen gegevens in de toekomst gelezen moeten worden. De jaren '80 staan wel eens bekend als het zwarte digitale tijdperk, omdat gegevens die destijds zijn opgeslagen nauwelijks nog zijn terug te lezen.
Inhoud |
[bewerk] Houdbaarheid van gegevensdragers
Een van de problemen voor digitale duurzaamheid is de houdbaarheid van gegevensdragers. Magnetische gegevensdragers, waarbij gegevens worden opgeslagen door magnetisch materiaal uit te richten, verliezen bijvoorbeeld na enkele jaren hun magnetische richting. Een recent probleem zijn beschrijfbare cd's. Deze blijken na enkele jaren te verrotten. Dit hangt ook af van het merk. Cd's van een onbekend merk kunnen het veel beter doen dan die van een populair merk (en omgekeerd).
Om gegevens duurzaam op te slaan is het nodig gegevensdragers te kiezen waarvan de houdbaarheid bekend is. Om de zoveel tijd zullen de gegevens op nieuwe, verse gegevensdragers opgeslagen moeten worden.
[bewerk] Beschikbaarheid van uitleesapparatuur
Zelfs al zijn de gegevensdragers in goede staat, dan kan het nog steeds een probleem zijn om de oude gegevens terug te lezen omdat benodigde apparatuur om het te lezen niet meer werkt, of zoals meestal het geval, gewoonweg weggedaan is. Reserveonderdelen zijn niet meer beschikbaar, en ook technici zijn vaak niet meer opgeleid om 'oude' apparatuur te repareren.
[bewerk] Beschikbaarheid van software
Zelfs al kunnen de oude gegevens gelezen worden, dan rest vaak nog een probleem, namelijk met welke software dat gedaan moet worden. In feite is ieder gegevensbestand niets anders dan een reeks nullen en enen, en als niet bekend is hoe dat moet worden geïnterpreteerd, dan is het nutteloos.
[bewerk] Oplossingen voor het digitaleduurzaamheidsprobleem
In principe is er geen algemene oplossing tegen digitale gegevensrot; iedere gegevensdrager heeft een houdbaarheid, uitleesapparatuur kan stuk gaan en software kan verloren gaan. In de praktijk blijkt het echter goed mogelijk om zich te wapenen tegen digitale gegevensrot. Alhoewel kort, levert de geschiedenis van de informatica ons voldoende voorbeelden om te weten wat wel en wat niet werkt.
[bewerk] Oplossingen op het gebied van de gegevensdragers
- Digitale gegevens van blijvend belang dient men van tijd tot tijd op nieuwe gegevensdragers overgezet worden.
- Men dient gegevensdragers kiezen welke lang meegaan:
- Magneetbanden kunnen enkele tientallen jaren mee mits ze goed opgeslagen worden.
- Harde schijven gaan eveneens tientallen jaren mee (mits ze natuurlijk niet continu draaien).
- Optische media zoals compact disc gaan relatief kort mee, zo'n 5 jaar. De reden is dat de materialen waarvan brandbare CD's en dvd's van gemaakt zijn chemisch onstabiel zijn. Geperste CD's zijn welliswaar zeer lang houdbaar, maar zij moeten in zulke grote aantallen gefabriceerd worden om economisch rendabel te zijn dat ze voor digitale duurzaamheid waardeloos zijn.
- Men kan gegevens op verschillende mediatypen opslaan en hierdoor het risico verminderen.
[bewerk] Oplossingen op het gebied van de opslagapparatuur
- Men dient altijd de apparatuur te bewaren om gegevens van opslagmedia te lezen waar men gegevens in bewaart. Dit kan zich beperken tot alleen de uitleesapparatuur, maar ook breder uitvallen, in veel gevallen zal men de complete computer moeten bewaren om zeker te zijn dat de gegevens teruggelezen kunnen worden.
- Men dient de gegevens zoveel mogelijk op moderne media over te zetten gedurende technologische overgangsperiodes.
[bewerk] Oplossingen op het gebied van de software
Oplossingen op het gebied van de software kunnen verdeeld worden in twee categorieën:
Het inlezen van oude gegevens met nieuwe software:
- Het inlezen van oude gegevens met oude software
- Software gebruikt door amateurs heeft een hogere houdbaarheid. Als we terugkijken op de jaren '80, dan kunnen we stellen dat de wereld van de mainframes van destijds nagenoeg volledig verloren gegaan is en dat de software die daarop draaide vandaag zeer moeilijk bruikbaar is. Als we naar de wereld van de homecomputers kijken, dan zien dat deze nagenoeg volledig bewaard is gebleven. De oorzaak is dat veel amateurs die zich destijds met bepaalde computers bezig hielden, veel tijd en energie gestoken hebben in het bewaren van die omgevingen voor het nageslacht; voor zowat iedere homecomputer bestaat er vandaag een emulator en er bestaan uitgebreide softwarearchieven van de programmatuur van destijds op internet. Vandaag is er doormiddel van hobbyclubs, zelfs nog steeds kennis over de machines van destijds aanwezig.
- Platformen die de industriestandaard zijn, hebben een hogere houdbaarheid dan platformen die dat niet zijn. Een goed voorbeeld hier is MS-Dos, software geschreven voor dit platform is vandaag nog steeds redelijk draaibaar en zal dat vermoedelijk blijven. Software geschreven voor, bijvoorbeeld Xenix, is vandaag nauwlijks draaibaar.
- Het inlezen van oude gegevens met nieuwe software
- De bekendheid van de structuur van een bestandsformaat bepaalt de houdbaarheid. Indien de bestandsstructuur van gegevens onbekend is, zal de houdbaarheid ervan beperkt zijn tot de houdbaarheid van de software om deze te lezen. Indien men geen controle heeft over deze software zullen gegevens langzaamaan onbruikbaar worden zodra de software van de markt verdwijnt.
- Indien de structuur van een bestandsformaat zeer bekend is is de kans het grootst dat toekomstige software functionaliteit zal hebben om de oude gegevens te lezen.
- Indien men geen bekende bestandsformaten kan gebruiken, kan men de structuur bij de gegevens bewaren. Backupsoftware plaatst aan het begin van een magneetband vaak een korte uitleg van de bestandsstructuur in standaard ASCII-formaat.
- Men dient op te passen voor het bestandsysteem; indien men weet hoe men de bestanden op een medium moet lezen maar niet weet wat de bestanden zijn omdat het bestandssysteem onbekend is, kan men nog niet bij de gegevens.