Historische Dokumente virtuell darstellen – Entwicklungen und Perspektiven

Im Rahmen der Vortragsrunde „Virtualisierung von Beständen“ haben fünf Referenten einzelne Projekte aus ihren Bibliotheken vorgestellt, die sich mit der Digitalisierung von historischen Beständen befassen und neue Entwicklungen auf dem Gebiet vorgestellt. Dabei wurde von einem Projekt der DDB berichtet, um Prozesse in der Zukunft zu beschleunigen, das Zusammenpuzzeln von Textfragmenten beleuchtet, ein DFG-gefördertes Projekt zur Optical Character Recognition erläutert sowie eine online-Darstellung zur wissenschaftlichen Forschung mit alten Handschriften vorgestellt.

Von Kristin Ameis

Die Vortragenden (v. l.): Gregor Neuböck, Dr. Thomas Stäcker, Elisa Herrmann, Stephan Bartholmei, Matthias Wehry. Foto: bibliotheksnews/ka

Gabriele Meßmer von der Bayrischen Staatsbibliothek hat die Runde der Vorträge moderiert. Den Auftakt machte Stephan Bartholmei  von der Deutschen Digitalen Bibliothek (DDB). Er beschrieb zunächst die Aufgaben der DDB und zeigte auf, dass ihr mit den stetig wachsenden Daten eine Überlastung droht und sie an ihre Systemgrenzen stößt. Um dieses Problem zu umgehen und für die Zukunft vorauszuplanen, entstand das Sonderprojekt des Bundes „DDB 2017“. Mit dem Umbau der DDB-Kernarchitektur sind das parallele Ablaufen von Prozessen, die Optimierung von einzelnen Prozessschritten sowie das Metadaten-Bereinigung im Self Service verbunden. So wird es den Datengebern ermöglicht, Änderungen an den Daten selbst einzuspielen. Damit werden zudem Geschäftsprozesse beschleunigt und neue Nutzungsstrategien eröffnet. Das letztliche Ziel ist, dass nicht mehr nur ein Suchindex vorhanden ist, sondern man eine echte Datenbank im Hintergrund zur Verfügung hat. Mithilfe der neuen Systemarchitektur ist die Vision der DDB für die Zukunft, 50 Millionen Objekte innerhalb von 24 Stunden transformieren und einspielen zu können.

Mit den Worten „schreibend gedacht – schneidend geordnet“ beschrieb Matthias Wehry von der Gottfried Wilhelm Leibniz Bibliothek – Niedersächsische Landesbibliothek in Hannover die Arbeitsweise des Philosophen und Mathematikers Gottfried Wilhelm Leibniz und leitete damit in die Darstellung des Projekts ein, in dem es darum ging, von Leibniz zerschnittene Textfragmente wieder zu dem eigentlich ursprünglichen Dokument zusammenpuzzeln.

Hier hat Wehry auf die Massendigitalisierung mit Scannern verwiesen, bei der sowohl die Vorder- als auch Rückseite gleichzeitig gescannt werden, sowie Durchlicht-Scans ermöglichen und damit Wasserzeichen deutlich gemacht werden können. Durch Kontur-, Textur-, Farb- und Kontextmerkmale können die einzelnen Fragmente schließlich digital wieder zusammengesetzt werden. Auch wenn eine vollständige Zusammenführung der einzelnen Textfragmente wegen der Verstreuung auf verschiedene Arbeitsorte Leibniz‘ nicht möglich ist, besteht das Ziel des Projektes doch darin, die auf 100.000 Blättern vorhandenen Notizen in Hannover wieder zusammenzusetzen.

Thomas Stäcker und Elisa Herrmann von der Herzog August Bibliothek Wolfenbüttel haben die Frage beantwortet, wie die digitalisierten Handschriften anschließend in eine maschinenlesbare Form gebracht werden können, um so für die wissenschaftliche Forschung zur Verfügung zu stehen. Stäcker hat dafür zunächst den bisherigen Weg historischer Dokumente im bibliothekarischen Arbeitsalltag aufgezeigt und verwies auf die Schritte von der Katalogisierung, über die Bild-Digitalisierung seit 2006 bis hin zur Optical Character Recognition (OCR) heutzutage. Er stellte das DFG-geförderte Projekt ORC-D vor, das sich auch als Netzwerk für Forscher, Entwickler und Anwender versteht. Herrmann hat die Ausführungen von Stäcker für einen beispielhaften Ablauf eines OCR-Durchgangs verdeutlicht. Neben den positiven Seiten machte sie auch auf Schwierigkeiten beim OCR aufmerksam. Die vollautomatische Nachkorrektur wird zum Beispiel durch dialektale Färbung oder uneinheitliche Rechtschreibung in den historischen Dokumenten erschwert.

Im letzten Vortrag der Runde stellte Gregor Neuböck von der Oberösterreichischen Landesbibliothek die Darstellung der digitalisierten Handschriften im Internet vor. Dabei wies er auf die Übersichtsseiten hin, die für jede Handschrift angelegt werden kann. Hier besteht die Möglichkeit, dass Wissenschaftlerinnen und Wissenschaftler ihre Forschungsergebnisse zu der jeweiligen Handschrift in Form eines Beschreibungsfeldes selbst anlegen und damit online publizieren. Die chronologische Forschung wird für jede Handschrift festgehalten und per PURL kann von Nutzern und Forschenden stetig auf die Tiefenbeschreibung verwiesen werden.  Abschließend verwies Neuböck darauf, dass die Darstellung sowohl für responsives Design realisiert wurde, sodass die Handschriften sogar auf mobilen Geräten lesbar sind.