article

Unter Langzeitarchivierung versteht man die Erfassung und langfristige Aufbewahrung von Informationen. Vor allem bei der Langzeitarchivierung digital vorliegender Informationen (digital preservation) stellen sich neue Probleme.

Während physikalische Objekte seit langer Zeit u.a. in Archiven, Museen und Bibliotheken aufbewahrt und erhalten werden, stellen sich bei elektronischen Publikationen ganz neue Herausforderungen. Daten, die auf digitalen Datenträgern gespeichert sind, können in relativ kurzer Zeit nicht mehr lesbar sein ("digitales Vergessen"). Die Ursachen für diesen Informationsverlust sind die begrenzte Haltbarkeit der Trägermedien und der schnelle Medien- und Systemwandel. Bei der Umgehung dieser Schranken bereiten unter anderem proprietäre Formate und urheberrechtliche Beschränkungen Probleme.

Probleme


Haltbarkeit der Trägermedien

Während beispielsweise altes Pergament und Papier bei guter Lagerung viele hundert Jahre haltbar sind, trifft dies auf neue Speichermedien nicht zu. Die meisten Publikationen aus der ersten Hälfte des 20. Jahrhunderts sind auf Papier gedruckt, das sich durch Säurefraß zersetzt. Bei älteren Druckwerken und Handschriften stellen sich andere Probleme: Wurde eisenhaltige Tinte bei der Herstellung verwendet, können die Buchstaben durch Feuchtigkeitseinwirkung einfach wegrosten und Löcher in den Seiten zurücklassen. Feuchtigkeits- und Temperaturschwankungen können auch Pergamenthandschriften zusetzen, weil durch Dehnung und Kontraktion die aufgetragene Schrift abplatzen kann.

Auch Filme, Fotos und Magnetbänder haben nur eine begrenzte Haltbarkeit. Noch kürzer ist die Lebensdauer digitaler Speichermedien wie Disketten und CDs. Datenträger verlieren ihre Informationen durch Umwelteinflüsse (z. B. durch Magnetfelder in der Nähe von Disketten oder Magnetbändern) oder sie werden durch chemische oder physikalische Einwirkungen so stark verändert, dass sie keine Informationen mehr speichern können oder nicht mehr auslesbar sind (z. B. UV-Strahlung auf CD-ROMs). Oft scheitert die Lesbarkeit auch nur daran, dass zu einem späteren Zeitpunkt die passenden Geräte und Programme nicht mehr vorhanden sind.

Lebensdauer einiger Datenträger
Medium Erwartete Lebensdauer
laut Hersteller
(In Klammern die
tatsächlich nutzbare Zeit)
Speicher-
dichte
(kbit/kg)
Steintafeln und Steinmalereien mehrere tausend Jahre 0,001...1
Bücher und Handschriften aus säurefreiem Papier und mit säurefreier und nicht eisenhaltiger Tinte mehrere hundert Jahre 3.000...30.000
Bücher und Handschriften aus säurehaltigem Papier (insbesondere Druckwerke des 19. und frühen 20. Jahrhunderts) 70 - 100 Jahre 3.000...30.000
Mikrofilm rund 500 Jahre (teilweise weniger als 500 Jahre)
Filme auf Zelluloid mehrere hundert Jahre (oft nur 50 bis 70 Jahre)
Herkömmliche Bücher 100-200 Jahre
Optische Speichermedien CD-ROM / DVD 25 - 100 Jahre CD: 4*10^8
DVD: 2...4*10^9
Zeitungspapier 10 - 50 Jahre
Disketten 5 - 10 Jahre
Magnetbänder bis zu 30 Jahre
REV-Festplatte bis zu 30 Jahre

Schneller Medien- und Systemwandel

Veraltete Datenformate
Da die Informationen nicht unmittelbar zugänglich vorliegen, sondern binär codiert sind, ist es nur möglich, die Informationen zu lesen, wenn ein Programm und ein Betriebssystem vorliegt, das den Inhalt einer Datei "versteht". Da viele Betriebssysteme und Programme ein eigenes (proprietäres) Verfahren einsetzen, um die Daten zu codieren, ist eine Lesbarkeit von Daten nicht mehr gegeben, wenn ein Betriebssystem oder ein Programm nicht weiterentwickelt wird. Verschärft wird dieses Problem durch die Politik vieler Softwarehersteller, neue Programmversionen mit veränderten Datenformaten zu veröffentlichen, die ältere Datenformate des gleichen Programms nicht vollständig nutzen können.

Veraltete Datenträger und Dateisysteme
Ähnlich wie bei den Datenformaten ist die Situation bei den Trägerformaten. Eine Datei, die vollständig und in einem noch lesbaren Dateiformat vorliegt, kann von fast allen Computerbenutzern nicht mehr gelesen werden, wenn sie auf einer 5,25"-Diskette liegt. Waren Laufwerke, die dieses Format lesen konnten, bis weit in die 1990er Jahre üblich, so sind heute kaum noch welche zu finden.

Weitere Beschränkungen

Proprietäre Systeme und urheberrechtliche Beschränkungen erschweren das zur Langzeitarchivierung notwendige Umkopieren und Migrieren von Daten, weil die dafür notwendigen Schritte nicht bekannt bzw. erlaubt sind. Vor allem die Einführung von Digitalem Rechtemanagement (DRM) wird das Problem in Zukunft noch verstärken.

Wiederfinden von Informationen

Es nützt nichts, Daten zu kopieren, man muss sie auch wiederfinden können. Daher müssen sie in Kataloge eingetragen werden, was bei größeren Datenmengen sehr aufwändig werden kann.

Datenkonsistenz

Ein oft übersehenes Problem bei der Langzeitarchivierung wie auch bei der Kurzzeitarchivierung ist die Überprüfung der Fehlerfreiheit der Daten. Daten können absichtlich modifiziert werden, aber auch durch Systemfehler unbemerkt verändert werden.

Verfahren


Grundsätzlich lassen sich bei der elektronischen Archivierung Methoden der Migration/Konversion und der Emulation unterscheiden.

Durch den Einsatz von offenen Standards wie z.B. Grafikformaten (TIFF, PNG, JPEG) oder freien Dokumentenformaten (XML,PDF/A), die als relativ langlebig betrachtet werden und deren Aufbau öffentlich bekannt ist, sind die Zyklen, nach denen eine Information umformatiert werden muss, länger. Die Wahrscheinlichkeit, dass es in einigen Jahren noch Systeme und Programme gibt, die die Daten lesen können, ist deutlich höher.

Um den Verlust von Daten durch die Alterung von Datenträgern zu verhindern, müssen die Daten regelmäßig innerhalb der garantierten Datensicherheitsdauer eines Mediums auf neue Datenträger kopiert werden. Dadurch kann auch auf ein neues Trägerformat gewechselt werden, wenn das bisher genutzte durch die technische Weiterentwicklung obsolet geworden ist.

Die hohen Kosten, die durch diese Pflege der Datenbestände entstehen, haben allerdings zur Folge, dass nur die wichtigsten Daten derart konserviert werden können. Die Informationsflut, die nicht zuletzt durch die neuen digitalen Datenverarbeitungssysteme entsteht, verschärft das Problem zusätzlich. Der Anteil der langfristig gespeicherten Daten wird notwendigerweise relativ gering sein, was an die Auswahl der gesicherten Informationen hohe Anforderungen stellt. Ein zusätzliches Problem entsteht durch das Auseinanderdriften des Verhältnisses zwischen Datenvolumen und Bandbreite. Das Volumen wächst deutlich schneller als die nötige Bandbreite um Daten von einem Medium auf ein anderes zu überspielen.

Dies betrifft nicht nur die Daten im staatlichen und kommerziellen Bereich, sondern auch im Privatbereich werden herkömmliche, oftmals langfristig lagerfähige Medien durch leichter handhabbare digitale Medien ersetzt (Photographien und Negative durch digitale Bilder auf einer CD-ROM).

Für die Langzeitarchivierung sind in Deutschland die Pflichtexemplarbibliotheken und die Archive zuständig.

Siehe auch


Literatur


  • Uwe M. Borghoff, Peter Rödig, Jan Scheffczyk, Lothar Schmitz: Langzeitarchivierung. Dpunkt Verlag, 2003 ISBN 3-89864245-3
  • Ralf Blittkowsky: Archivieren der Berechnungsformeln?. In Telepolis. Heise-Verlag 14. Februar 2004
  • Georg Hohmann: Digitale Ewigkeit und virtuelle Museen. In: Telepolis. Heise-Verlag 30. Oktober 2003
  • Ulrich Kampffmeyer, Jörg Rogalla: Grundsätze der elektronischen Archivierung. VOI-Kompendium Band 3. VOI Verband Organisations- und Informationssysteme e. V., Darmstadt 1997, ISBN 3-932898-03-6.
  • Roy Rosenzweig: Scarcity or Abundance? Preserving the Past in a Digital Era. In: American Historical Review 108, 3 Juni 2003, S. 735-762
  • Guidelines for the Preservation of Digital Heritage. UNESCO, March 2003. http://unesdoc.unesco.org/images/0013/001300/130071e.pdf
  • Digital Preservation Tutorial. Cornell. http://www.library.cornell.edu/iris/tutorial/dpm/
  • Helfer, Bernward & Lupprian, Karl-Ernst (Bearb.): "Dateiformate. Eigenschaften und Eignung für die Archivierung elektronischer Unterlagen. Eine Handreichung für Archivarinnen und Archivare." Wiesbaden und München 2004. http://www.gda.bayern.de/datfor.pdf
  • Bundesamt für Sicherheit in der Informationstechnik (Hrsg.), IT-Grundschutzhandbuch. (Hier: Abschnitt M 4.170: Auswahl geeigneter Datenformate für die Archivierung von Dokumenten). http://www.bsi.bund.de/gshb/deutsch/m/m04170.html

Weblinks


Archiv | Bibliothekswesen | Dokumentation | Museum | Retrodigitalisierung

Digital preservation

 

This article is licensed under the GNU Free Documentation License. It uses material from the "Langzeitarchivierung".

Home Pageartsbusinesscomputersgameshealthhospitalshomekids & teensnewsphysiciansrecreationreferenceregionalscienceshoppingsocietysportsworld