Das Karriereportal für Wissenschaft & Forschung von In Kooperation mit DIE ZEIT Forschung und Lehre

Im virtuellen Lesesaal

VON CHRISTOPH DRÖSSER

Noch ein Jahr, dann soll die Deutsche Digitale Bibliothek starten. Ein überzeugendes Konzept, wie sie funktionieren soll, fehlt noch.

Im virtuellen Lesesaal© pagadesign - iStockphoto.comEines Tages sollen die digitalen Bestände aus 30.000 Bibliotheken, Archiven und Museen der Allgemeinheit zur Verfügung stehen
Da gibt es diesen Traum: dass man in allen Büchern, die je in deutscher Sprache erschienen sind, nach Begriffen suchen kann, so einfach wie mit Google im Netz. Man gibt ein Wort in ein Suchfeld ein, lässt sich die besten Treffer dazu anzeigen und kann dann postwendend in dem jeweiligen Buch auf jener Seite lesen, auf der die gesuchten Begriffe vorkommen. Nun soll dieser Traum wahr werden. Im vergangenen Jahr beschlossen Bund und Länder die Einrichtung einer Deutschen Digitalen Bibliothek (DDB), am Dienstag dieser Woche hat sich ihr »Kompetenznetzwerk« in Berlin konstituiert, Ende 2011 soll die erste Version online gehen. Eines Tages dann, so der Plan, sollen die digitalen Bestände aus 30 000 Bibliotheken, Archiven und Museen der Allgemeinheit zur Verfügung stehen. Bis dahin ist es allerdings noch ein weiter Weg.

»Wer die Zahl 30 000 erfunden hat, weiß ich auch nicht«, sagt Norbert Zimmermann, stellvertretender Präsident der Stiftung Preußischer Kulturbesitz, bei der das Büro der DDB Unterschlupf finden wird. Aber er weiß, dass das Büro ab Januar eine Menge zu tun haben wird: Vor allem gilt es, eine Bestandsaufnahme zu machen, was denn nun bei diesen vielen Institutionen alles schon digital vorhanden ist. Es müssen technische Fragen geklärt werden, damit die an vielen Stellen gespeicherten Dokumente auf einer einheitlichen Benutzeroberfläche präsentiert werden können. Dafür ist das Leibniz-Institut für Informationsinfrastruktur (FIZ) in Karlsruhe zusammen mit dem Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme zuständig. Und es wartet ein Dickicht von rechtlichen Fragen, schließlich wollen manche Institutionen mit ihren »Digitalisaten« auch Geld verdienen.

Die wichtigsten Verbündeten des Projekts sind die großen wissenschaftlichen Bibliotheken in Deutschland. Fast alle stehen dem digitalen Traum sehr positiv gegenüber - die größten Bücherfans sind auch die größten Anhänger der Scan-Projekte. Die Bibliotheksdirektoren haben in den vergangenen Jahren feststellen können, dass jeder Digitalisierungsschritt nicht weniger, sondern mehr Menschen in ihre Büchertempel getrieben hat. Das mag paradox klingen. Aber wenn ein Buch leichter zu finden ist, dann wird es auch öfter gelesen. Und die Bibliothek ist immer weniger ein bloßer Aufbewahrungsort für Bücher. Gerade die durchs Internet sozialisierten Studenten schätzen sie als Ort der Muße, der Begegnung, der gemeinsamen Arbeit. Milan Bulaty ist Direktor des vor einem Jahr in Berlin eröffneten schicken Jacob-und-Wilhelm-Grimm-Zentrums, der Bibliothek der Humboldt-Universität. Er lacht, wenn er davon erzählt, dass manche Politiker den Neubau für zu groß gehalten hatten. Die erwarteten Nutzerzahlen wurden weit übertroffen, die Studierenden müssen Parkscheiben auf ihren Platz legen, wenn sie ihn verlassen - wer länger als eine Stunde wegbleibt, dessen Sachen werden abgeräumt. »Wir hätten eine doppelt so große Bibliothek bauen können, auch die wäre ständig voll«, sagt Bulaty.

Wie Bulaty ist auch Ulrich Johannes Schneider, Direktor der Universitätsbibliothek in Leipzig, ein Fan der Digitalisierung. Im wunderschön renovierten Gebäude der zweitältesten deutschen Bibliothek ist er Herr über 5,4 Millionen Bücher - und freut sich über jedes, das er digital präsentieren kann. »Ich habe gerade wieder Dankesmails aus Amerika bekommen«, erzählt er - seltene Drucke werden weltweit zugänglich, und die Bibliothek kann sie wegschließen. Das schont den kostbaren Bestand. Schon heute gibt es das Zentrale Verzeichnis Digitalisierter Drucke, eine von der Deutschen Forschungsgemeinschaft (DFG) geförderte Sammlung von Büchern, die per Scanner abgelichtet und ins Netz gestellt worden sind. Die über die Website www.zvdd.de zugängliche Sammlung erfasste bei Redaktionsschluss allerdings gerade mal 141 695 Werke - dabei hat allein die Bayerische Staatsbibliothek schon 400 000 Digitalisate ins Netz gestellt. Der Bücherfreund kann nicht in den Büchern selbst suchen, sondern nur in bibliografischen Angaben wie Titel, Sachgebiet und Autor.

Das soll künftig anders werden. Mit 2,6 Millionen Euro jährlich wird die Deutsche Digitale Bibliothek aus Bundes- und Landesmitteln gefördert, aus den Konjunkturprogrammen gibt es noch einmal die eine oder andere Million extra. Allerdings geht nichts davon in die tatsächliche Digitalisierung von Büchern. Die geschieht derzeit dezentral - und teilweise in chaotischer Manier. »Keiner spricht sich mit dem anderen ab, deshalb kommt es zu Doppeldigitalisierungen - eigentlich ist das eine Verschleuderung von Steuergeldern! «, schimpft Ulrich Johannes Schneider. Was dringend fehle, sei ein nationales Konzept. Es gibt nämlich durchaus unterschiedliche Ansätze zur Digitalisierung, abhängig von der Zielgruppe. Wendet man sich an Wissenschaftler, Studenten oder die Allgemeinheit? Davon hängt es ab, was für Bücher man auswählt, wenn man begrenzte Mittel hat.

Am einfachsten ist der Google-Ansatz. Die Gründer Larry Page und Sergei Brin nahmen sich 1998 vor, »die auf der Welt vorhandenen Informationen zu organisieren und allgemein zugänglich und nutzbar zu machen«. Wer eine solche Mission hat, der kann die Frage, welche Bücher gescannt werden sollen, leicht beantworten: alle. Man fängt am besten links oben im Bücherregal an und hört rechts unten auf. Konkret sieht das so aus: Google fährt mit Lieferwagen bei den Bibliotheken vor und verfrachtet die Buchbestände Zug um Zug in geheime Digitalisierungszentren, wo Scan-Roboter die Bücher automatisch einlesen. Dann werden sie zurück an die Bibliothek geliefert. In Deutschland ist die Bayerische Staatsbibliothek in München der einzige Google-Partner. »Die Kritik war groß, als wir uns der "Datenkrake" Google ausgeliefert haben«, erzählt der Bibliothekssprecher Peter Schnitzlein. Inzwischen sind die Kritiker verstummt, und so mancher Kollege aus anderen Bibliotheken schaut mit Neid auf den wachsenden digitalen Bestand in München.

Keinen Cent zahlt die Staatsbibliothek an Google. Gescannt werden sämtliche Werke, deren Urheberrechtsschutz erloschen ist, von 1600 bis zum Ende des 19. Jahrhunderts. Das sind etwa eine Million Bände, 40 Prozent davon sind schon erfasst. Wo Googles Scan-Zentrum sich befindet, will Schnitzlein nicht verraten, »aber die Bücher verlassen Bayern nicht«. Von Google bekommt die Bibliothek eine digitale Kopie jedes Buchs, mit der sie machen kann, was sie will. Außerdem lässt Google die eigene Software zur automatischen Texterkennung (OCR) über die Scans laufen - insbesondere bei deutscher Frakturschrift keine triviale Sache - und stellt auch diesen Text zur Verfügung. In der Anfangszeit wurde viel über Googles mangelnde Scan-Qualität gespöttelt, es war schon einmal eine Hand auf der fotografierten Seite zu sehen. Das ist heute kein Thema mehr. »Es ist erstaunlich, mit welcher Geschwindigkeit Google Innovationen vorantreibt«, sagt Schnitzlein. Das bestätigt auch Markus Brantl, Leiter der bayerischen Digitalisierung. Insbesondere die Schrifterkennung habe in der letzten Zeit gewaltige Fortschritte gemacht: »Es ist überraschend, wie gut die Software selbst die älteren Frakturschriften des 17. und 18. Jahrhunderts erkennt.« In anderen Bibliotheken gilt Fraktur immer noch als unentzifferbar, und man erfasst nicht den Volltext der gescannten Bücher.

Der Vertrag mit Google bringt der Münchner Bibliothek nur Vorteile, sie kann die Dateien nach den eigenen bibliothekarischen Kriterien katalogisieren und auf dem eigenen Server lagern. »Die öffentliche Hand«, sagt Peter Schnitzlein, könnte so etwas nie leisten.« In Deutschland ist kein staatlicher Geldgeber in Sicht, der für eine systematische Erfassung der Kulturgüter aufkommen würde. Anders als in Frankreich, wo die Regierung 750 Millionen Euro für eine nationale Digitalisierungsoffensive zur Verfügung gestellt hat, werden in Deutschland nur einzelne Projekte gefördert, vor allem von der DFG. Das ist es, was der Leipziger Bibliotheksdirektor Schneider kritisiert: Jeder versucht, solche projektbezogenen Mittel zu bekommen, stellt ein paar Scanner auf und digitalisiert drauflos. Aber sind das wirklich die Bücher, die gebraucht werden? Soll man als Erstes Unikate scannen, die sonst nirgends existieren (wie es in Halle geschieht), oder lieber komplette Sammlungen (wie in Weimar)? Erfüllt man damit die Wünsche einer breiten Öffentlichkeit, oder befriedigt man nur eine kleine Schar von Professoren?

Eine gewisse Koordinierung gibt es zwischen den fünf Bibliotheken, die am sogenannten Projekt VD 18 beteiligt sind. Das Kürzel steht für die Digitalisierung aller deutschsprachigen Drucke aus dem 18. Jahrhundert, rund 600 000 Bücher. Anders als die Vorgängerprojekte VD 16 und VD 17, die lediglich Verzeichnisse waren, sollen diesmal alle Werke komplett digital erfasst werden. Gut 17 000 Bücher sind bereits gescannt, bibliografisch aufgearbeitet und im Internet verfügbar. In ihrem Volltext suchen wie in Google Books kann man allerdings nicht - die OCR-Erfassung gehört nicht zum Programm. Wissenschaftlern mag diese Art der Erfassung genügen, ihre Studierenden aber sind bereits Google-verwöhnt und erwarten eine Volltextsuche. Diese mangelhafte Erschließung ist keine Katastrophe - solange man ein gutes digitales Bild hat, kann man auch später noch die Schrifterkennungs-Software darüberlaufen lassen. Echte Probleme tauchen auf, wenn man sich dem 19. und 20. Jahrhundert nähert (und damit den Büchern, an denen die allgemeine Öffentlichkeit das größte Interesse hat). Da ist zunächst die schiere Masse der Veröffentlichungen, es kommt aber noch ein weiteres Problem hinzu: das Urheberrecht.

Das erlischt in Deutschland nämlich erst, wenn der Autor 70 Jahre tot ist. Solange ein Buch noch im Druck ist, kann man sich mit dem Verlag darüber auseinandersetzen. Der größte Teil der Bücher des 20. Jahrhunderts wird aber nicht mehr aufgelegt, es gibt nur Restexemplare in den Bibliotheken, und oft ist nicht einmal mehr ermittelbar, wem die Rechte gehören. Diese »verwaisten Bücher« sind es, mit denen die neuen digitalen Bibliotheken die größten Probleme haben. Im vergangenen Jahr hat sich die deutsche Kulturszene noch über das forsche Vorgehen von Google erregt. Nun sieht man langsam ein, dass eine Verfügbarkeit dieser Werke, mit deren Druck niemand mehr Geld verdienen kann, im Netz durchaus wünschenswert ist. »Hier droht unserer Gesellschaft wichtiges Kulturgut verloren zu gehen«, sagt Harald Schütt, Pressesprecher von Bundesjustizministerin Sabine Leutheusser-Schnarrenberger.

Nach einer Expertenanhörung im Oktober will das Ministerium nun das Urheberrecht novellieren. Digitale Bibliotheken sollen demnach zunächst sorgfältig nach den Rechteinhabern suchen. Finden sie niemanden, dann dürfen sie, ähnlich wie Google in den USA, das Buch digital ins Netz stellen, müssen aber eine Vergütung zahlen, die von der VG Wort verwaltet wird - falls sich der Rechteinhaber doch noch findet. Rechtlich scheint die Digitale Bibliothek also auf einem guten Weg zu sein. Auch die technischen Probleme lassen sich lösen. »Was fehlt, ist der gesellschaftliche Diskurs. Ein Plan muss her«, sagt Ulrich Johannes Schneider. Und jemand, der die Idee der Digitalen Bibliothek offensiv in der Öffentlichkeit vertritt. Hermann Parzinger, Präsident der Stiftung Preußischer Kulturbesitz und Hausherr des neuen Bibliotheksbüros, wäre ein Kandidat dafür. Noch hat man von ihm allerdings wenig Visionäres zu dem Thema gehört.

Aus DIE ZEIT :: 02.12.2010

Ausgewählte Artikel
Ausgewählte Stellenangebote