Bundesarchiv in Bern

"Bei der Digitalisierung spielen wir in der ersten Liga"

Uhr | Aktualisiert
von Christoph Grau

Das Bundesarchiv in Bern treibt das elektronische Archiv voran. Bundesarchivdirektor Andreas Kellerhals und Stefan Kwasnitza, Leiter Abteilung Informationszugang, erläutern im Gespräch ihre Zukunftsvisionen.

Können Sie zunächst einen Überblick über die Geschichte der Digitalisierung im Bundesarchiv geben?

Andreas Kellerhals: Zunächst ist hier die Frage, was Digitalisierung eigentlich heisst. Man könnte sagen, dass wir vor 30 Jahren begonnen haben. Damals gab es noch sogenannte Kompetenzkarten. Das sind Karteikarten mit Informationen zu den Beständen, die in unzähligen Kästen untergebracht waren. Diese mussten wir per Hand abschreiben und in eine digitale Form bringen. Wenn Sie sich das heute anschauen, dann bekommen Sie fast einen Lachanfall. Man bildete damals auf einem Bildschirm die Karte eins zu eins nach. Wenn ein Wort am Zeilenende mit einem Bindestrich getrennt war, dann wurde das einfach so übernommen. Dies erschwerte natürlich die Suche erheblich. In den 90er-Jahren wurden die Findmittel dann von Hand abgetippt. Die OCR-Texterkennung genügte damals unseren Ansprüchen noch nicht. Diese Informationen sind heute noch die Basis für unser Online-Recherchetool. Mehrere Personen waren über Jahre damit beschäftigt.

Wann sind Sie die Archivbestände angegangen?

Kellerhals: Wir begannen etwa zwischen 2004 bis 2006 mit den sogenannten Amtsdruckschriften. Als Erstes digitalisierten wir das Bundesblatt. Dies betrifft die Schriften von 1848 bis etwa 1998. Die Texte wurden dann mit Texterkennung versorgt. Davon ausgehend erschlossen wir dann schrittweise weitere Bestände, etwa die Staatrechnungen und Rechtstexte. Wir verfolgen in den letzten Jahren eine konsequente Digitalisierungsstrategie.

Sie sind gerade dabei, mit dem Bundesrat die Digitalisierungsphase 2016 bis 2020 abzustimmen. Können Sie schon ein paar Details verraten?

Kellerhals: Die Strategie 2016 bis 2020 ist jetzt in Vorbereitung. Zum jetzigen Zeitpunkt kann man festhalten, dass der eingeschlagene Weg der Transformation des Bundesarchivs zu einem digitalen Archiv weiterverfolgt wird. Anhand zweier Projekte wollen wir dies zunächst exemplarisch durchführen. Für diese gab der Bundesrat auch im Prinzip grünes Licht. Er ist inhaltlich mit der Ausrichtung einverstanden. Die Fragen zu den Mitteln sind aber noch nicht abschliessend beantwortet.

Um welche beiden Projekte handelt es sich?

Kwasnitza: Der Bundesrat beauftragte das Bundesarchiv, einen Onlinezugang zum Archivgut des Bundes zu schaffen. Damit werden Verwaltung und Öffentlichkeit die Möglichkeit erhalten, sämtliche archivierten Unterlagen des Bundes online zu konsultieren. Es soll allen Interessierten möglich sein, im Katalog des Bundesarchivs – dem „virtuellen Lesesaal“ – zu recherchieren und die gewünschten Unterlagen direkt online zu konsultieren. Diese Erneuerung steht im Einklang mit den bundesrätlichen Strategien zur Informationsgesellschaft und zum E-Government in der Schweiz. Mit dem Onlinezugang wird sichergestellt, dass digitale Unterlagen des Bundes langfristig benutzerfreundlich zugänglich bleiben. Das Bundesarchiv baut den Onlinezugang abhängig von der Sicherstellung der entsprechenden Finanzierung in den nächsten Jahren auf.

Nach welchen Prioritäten digitalisieren Sie Ihre Bestände?

Kellerhals: Wir fahren hier zweigleisig: Zunächst richten wir uns nach der Nachfrage der Nutzer. Dann beziehen wir aber auch Bestände ein, die wir für interessant und wichtig halten.

Die Archivierung ist ein Aspekt, aber wie weit sind Sie beim digitalen Zugriff auf die Daten?

Kellerhals: Beim Zugriff auf die Daten stellen sich gewichtige Fragen. Der Zugang muss ja dem Wesen des Digitalen gemäss organisiert sein und kann sich nicht allein auf eine reine „Digitalisierung“ der bisherigen Angebote beschränken. Wir sind hier noch nicht so weit, aber die Konzeptphase ist schon weit fortgeschritten. Es braucht jetzt einfach eine Gesamtschau, um das Paket der elektronischen digitalen Archivierung zuschnüren zu können.

Wie stellen Sie sich die Zukunft des digitalen Archivs vor?

Kellerhals: Unser Wunsch wäre es, dass der Nutzer mit einem Klick direkt auf ein Dokument, das er über eine Suchmaske findet, zugreifen und es weiterverwerten kann. Doch die Frage ist vor allem: Wie findet er das Dokument? Einfach über den Katalog oder über andere Wege?

Kwasnitza: Das Dokument an sich ist aber nur der eine Aspekt. Wichtig ist auch, wie wir alle nötigen Informationen in diesem neu geschaffenen virtuellen Arbeitsplatz unterbringen können. Dazu gehören etwa das Wissen um die Kompetenzen der Verwaltungseinheiten und ihre Veränderung über die Zeit. Die eigentliche Digitalisierung ist hier nur ein erster Schritt.

Was meinen Sie damit genau?

Kwasnitza: Uns ist wichtig, dass die Informationen in dem Kontext genutzt werden können, der sie erst richtig verständlich macht. Das Stichwort ist hier: Authentizität der Informationen als unser Angebot und die Quellenkritik als methodische Voraussetzung auf der Nutzungsseite. So weit in unserer Hand wollen wir dies unbedingt gewährleisten.

Welche Rolle spielen dabei die von Ihnen verwendeten technischen Standards?

Kwasnitza: Die Standards sollen vor allem die Nachvollziehbarkeit sicherstellen. Das machen wir auch heute schon, wenn wir etwa Dokumente digitalisieren und daraus PDFs erstellen. Dabei richten wir uns nach JPEG 2000 und einen Standard namens PREMIS (Preservation Metadata: Implementation Strategies). Wir wollen bei den verwendeten Standards sicherstellen, dass die Dateien später auch noch für andere Zwecke weitergenutzt werden können, unabhängig von deren ursprünglichen Nutzung. So soll es etwa auch möglich sein, die Daten in neue Frameworks einzubringen. Damit wollen wir die Grundlage schaffen, dass die Daten später auch für andere Zwecke weiterverwendet werden können. Denn wir können noch nicht absehen, in welche Richtung die Forschung mit den Daten gehen wird.

Können Sie dies noch an einem Beispiel veranschaulichen?

Kwasnitza: Wenn man den Gebrauch anschaut, dann gab es in der Vergangenheit beispielsweise die Epidemiologen, die die Daten auswerteten, um Rückschlüsse über Krankheiten ziehen zu können. Mit den gleichen Beständen setzen sich auch Historiker und andere Wissenschaftler auseinander. Je nach Fach sind Gebrauch und Verwendung ganz anders, und auf all diese unterschiedlichen Ansprüche wollen wir vorbereitet sein.

Mit welchen Schwierigkeiten haben Sie bei den von Ihnen verwendeten Standards zu kämpfen?

Kwasnitza: Die grösste Herausforderung ist die Kombination von Primär- und Metadaten in einem Datenpaket. Es gilt, Originalität, Authentizität, Integrität und Benutzbarkeit zu erhalten. Neben der Erhaltung der Substanz der digitalen Unterlagen auf Ebene des „Bitstream“ gilt es, mit geeigneten Formaten dafür zu sorgen, dass die digitalen Unterlagen und deren Kontext darstellbar und interpretierbar bleiben. Besonders das Einspeisen und das Herausziehen sind die grössten Herausforderungen. Wir richten uns da nach den Vorgaben der OAIS(Open Archival Information System)-Modelle, die alle zu archivierenden Informationen in Paketen bündelt, die in drei Typen definiert sind: SIP (Submission Information Package) für die Ablieferung der digitalen Unterlagen, AIP (Archival Information Package) für die Speicherung der digitalen Unterlagen im Archiv und schliesslich das DIP (Dissemination Information Package) für die Auslieferung der digitalen Unterlagen. Wir machen diese schon automatisiert.

Was sind die grössten Herausforderungen beim Digitalisierungsprozess?

Kwasnitza: Die grösste Herausforderung ist das zu digitalisierende Archivgut selbst. Uns liegen hier keine einheitlichen Dokumente vor. Zwar haben wir keine mittelalterlichen Handschriften, aber die Heterogenität der Akten stellt uns auch vor grosse Probleme. So sind etwa mehrere unterschiedlich grosse Papierbögen mit unterschiedlicher Papierstärke in einer Schachtel zusammen untergebracht. Gleichzeitig ist der Kontext, warum diese Dokumente in dieser einen Schachtel abgelegt sind, sehr wichtig. Für jedes Dokument muss der Kontext lückenlos hinterlegt sein. In der Vorbereitung muss daher sichergestellt sein, dass die Metadaten des Kontextes mit eingearbeitet sind. Dabei arbeiten wir im Fünferschritt: Vorbereitung, Scannen, Datenaufbereitung und Kontrolle, Abschlussaufbereitung und zuletzt die Sicherung. Wir achten hier sehr stark auf die Qualität in diesem Prozess.

Welche Hauptbefürchtungen hat die Nutzerseite?

Kellerhals: Die Nutzer haben ein starkes Misstrauen. Häufig wird befürchtet, dass die Informationen nach der Digitalisierung nicht vollständig sein könnten – etwa, dass zwei Blätter gleichzeitig durch den Scanner liefen. Wenn wir originale Akten vorlegen, hat niemand das Gefühl, dass wir etwas herausgenommen haben. Beim Mikrofilm ist das Vertrauen auch sehr gross. Ich kann das Misstrauen gegenüber dem Scan daher nicht nachvollziehen.

Ist das vielleicht nur ein vorübergehendes Phänomen?

Kellerhals: Ja, davon bin ich überzeugt. Aber wir müssen mit diesem momentanen Misstrauen umgehen. So irrational es für uns auch sein mag, es ist einfach eine Realität.

Können Sie ein Beispiel für diese Forschung am digitalen Gut nennen?

Kellerhals: Ein gutes Beispiel ist die Stapfer-Enquête. In dieser führte der Erziehungsminister der Helvetischen Republik im Jahr 1799 umfangreiche statistische Forschungen durch. In einem Projekt mit der Universität Bern digitalisierten wir Mikrofilme. Die Forscher verlinkten die Daten dann mit Geodaten und transkribierten sie. All diese Informationen wurden von der Hochschule online gestellt und können frei eingesehen werden.

Kwasnitza: An diesem Projekt ist auch noch spannend, dass die Uni Bern die Daten als Linked-Open-Data (LOD) bereitstellen wollte. Damit sollen die Daten in einen weiteren Suchraum eingefügt werden und für die Öffentlichkeit zugänglich sein. Für das Projekt gibt es auch eine Website: www.stapferenquete.ch.

Durch die Digitalisierung ergeben sich also völlig neue Forschungsfelder. Könnten gerade mit intelligenten Algorithmen nicht viel schneller Zusammenhänge in grossen Dokumentenbergen herausgefunden werden?

Kellerhals: Ja, ich glaube, hier gibt es sehr viel Potenzial.

Kwasnitza: Für mich tun sich da völlig neue Felder auf. Es gibt etwa die Analyse der Verwendung von Begriffen in der Forschung, die in der Literatur, aber auch in öffentlichen Dokumenten. Im Prinzip sind der Fantasie da keinen Grenzen gesetzt. Mit digitalisierten Dokumenten und der Unterstützung von Computern geht die Analyse in diesem Forschungsfeld ungemein schneller. Und je nach Fachgebiet suchen die Forscher in den gleichen Materialien nach unterschiedlichen Dingen.

Kann man die Digitalisierung von Dokumenten als eine Form der Demokratisierung des Archivguts sehen?

Kwasnitza: Kann man so sagen, ja. Indem Dokumente auch externen Personen zugänglich gemacht werden, erfahren sie eine neue Wertung und Interpretation. Mit diesen Informationen können dann auch Laien arbeiten. Das hat vielfältige Aspekte. Wir wollen die Informationen verfügbar machen. Dies ist eine Neuinterpretation des klassischen Archivbegriffs, der seinen Ursprung in der Verwahrung hat. Wir wollen hingegen eine Plattform bieten, damit die Leute darauf zugreifen können. Wie diese Daten dann von den Nutzern verwendet werden, wollen wir ihnen überlassen. Ein Stichwort ist hier Open-Government-Data.

Kellerhals: Ich sehe es auch als eine Form der Demokratisierung. Gerade die Schwellenangst wird erheblich reduziert, wenn man als anonymer Nutzer von zuhause aus auf die Archivmaterialien zugreifen kann. Da kann man auch mal schnell etwas ausprobieren. Wenn es nicht klappt, kann man sich auch wieder etwas anderem zuwenden. Eine Rechtfertigung für die Verwendung der Daten entfällt.

Ist die Digitalisierung also nur mit Vorteilen für die Arbeit mit Archivalien verbunden?

Kellerhals: Während unseres Gesprächs fiel mir auf, dass es durchaus bei dem Aspekt der Sprache Schwierigkeiten geben kann. Denn wenn Sie etwa über den gesamten Zeitraum, den unser Bestand umfasst, einen Begriff suchen, dann hat sich nicht nur die Schreibweise von „Teater“ in „Theater“ oder „Photographie“ in „Fotografie“ geändert, sondern auch die gesamte Terminologie war einem Wandel unterzogen. So sind etwa Kernkraftwerke zu Atomkraftwerken geworden. Daher ist die Suche in den Beständen schon eine erhebliche Herausforderung. Ganz schwierig wird es bei Themen wie der Judenverfolgung im Dritten Reich. Wenn Sie dann nach „Jude“ suchen, werden Sie kaum etwas finden. Doch anzunehmen, dass es deswegen überhaupt nichts gibt, ist ein Trugschluss. Hier muss man die passenden Terminologien aus der Zeit kennen. Es besteht daher die Gefahr, dass voreilige Schlüsse gezogen werden. Die Vorgehensweise wie bei Google mit nur einem Suchbegriff ist auf Archive so nicht ohne Weiteres übertragbar. Daran werden die ungeübteren Nutzer möglicherweise am Anfang auch scheitern.

Aber Thesauri könnte dies doch teilweise abfangen.

Kwasnitza: Ja, die richtige Verschlagwortung ist schon sehr hilfreich. Ich glaube, dass die Interoperabilität der Daten der wichtige Aspekt ist. Ich meine damit, dass man die Daten nachnutzen kann, indem sie an übergeordnete Begriffe angebunden werden. Dies wird durch übergeordnete Dateien erreicht, die verschiedene Inhalte zusammenfügen. Ein Prinzip, dass man auch von Wikipedia her kennt.

Wo steht das Bundesarchiv bei der Digitalisierung im internationalen Vergleich?

Kwasnitza: Ich meine, wir stehen weit vorne. Ohne uns selbst loben zu wollen, glaube ich, dass nur die Amerikaner und die Briten etwas weiter sind als wir. Wir spielen mit diesen beiden aber in einer Liga.

Wie sieht es mit der internationalen Vernetzung aus?

Kwasnitza: Das Bundesarchiv hat eine Brückenfunktion zwischen dem deutschen und französischen Sprachraum, was uns in Europa fast einmalig macht. Wir pflegen auch enge Kontakte in Europa. Ich nenne hier das Archival-Portal-Europe (Apex), in das wir aktiv eingebunden sind. Ziel ist es hier, die Archivdaten auf europäischer Ebene verfügbar zu machen, um auch kleineren Archiven zu mehr Visibilität zu verhelfen. Apex ist ein Projekt der Europäischen Kommission, in das die Schweiz und fast alle europäischen Staaten eingebunden sind. Zudem sind wir auch Mitglied des globalen Dachverbands International Council on Archives (ICA).

Wie finanzieren Sie Ihre Digitalisierungsprojekte?

Kwasnitza: Das Bundesarchiv wird direkt vom Bund, genauer dem Departement des Inneren, finanziert.

Wie gross ist das Team für die Digitalisierung?

Kwasnitza: Insgesamt arbeiten ungefähr 80 Personen im Archiv. In meiner Abteilung, dem Informationszugang, sind es ungefähr 30 Mitarbeiter. In die verschiedenen Prozessetappen der Digitalisierung sind aber immer andere Gruppen von Mitarbeitern eingebunden, daher ist die genaue Zahl schwer zu schätzen.

Und sind die Mittel für Ihre weiteren Projekte ausreichend?

Kellerhals: Das ist immer eine spannende Frage. Grundsätzlich reichen die Mittel nie aus. Es gibt aber zwei Ansätze, mit dieser Knappheit umzugehen, wie ich in den letzten Jahren gelernt habe. Der eine Ansatz ist zu fragen: Was braucht es, um es perfekt zu machen? Dann aber reichen die Mittel nie. Der bessere Ansatz ist, zu schauen, wie viel es gibt, und dann zu überlegen, wie viel damit erreicht werden kann. Wir gehen in der Regel den zweiten Weg. Mit diesem Ansatz sind wir zwar etwas langsamer, kommen aber zu einem Ziel. Das Spannende ist, dass sich das technische Umfeld auch dermassen verändert, dass wir zu Lösungen, die wir vor fünf Jahren in mühsamer Kleinarbeit finden mussten, heute sehr viel schneller gelangen. Daher bin ich auch sehr zuversichtlich, dass wir zu sehr spannenden Angeboten kommen werden.

Welche Langzeitziele verfolgen Sie?

Kellerhals: Ich meine, das Fernziel unseres Informationsangebots ist es, dass zum Beispiel politische Diskussionen, gestützt auf eine klare Faktenlage geführt und Entscheidungen in einem klareren Licht gefällt werden können. Die Auswahl der als wesentlich verstandenen Informationen ist dabei letztlich auch eine politische oder wissenschaftliche. Beim Bau einer Autobahn dürfen Sie etwa gewisse geografische Gegebenheiten nicht ignorieren, dennoch gibt die Kenntnis der Naturlage nicht einfach eine einzige konkrete Linienführung vor, sondern eröffnet Möglichkeiten. Sie brauchen dann weitere Informationen, um zu entscheiden, wo genau im Rahmen des Möglichen die Strasse realisiert werden soll. Unser Beitrag soll es sein, dass Wichtige und Wesentliche für Entscheidungen bereitzustellen und die Entscheidinstanzen in die Lage zu versetzen, dieses fundiert auszuwählen. Es reicht nicht aus, dass wir alles einfach im Archiv verstauen, sondern es muss greifbar sein, wenn es jemand sucht. Und es ist unser Ziel, dass man auch etwas Hilfreiches finden kann, wenn man nicht direkt im Archiv sucht, sondern einfach googelt. Dies ist meine Vision.

Bis wann glauben Sie, dieses Ziel erreicht zu haben?

Kellerhals: Ich werde 2019 pensioniert, wenn alles gutgeht. Es wäre schon schön, wenn es bis dahin klappt. Aber wenn es erst 2022 so weit ist, dann ist es auch gut. Hauptsache, das Ziel wird erreicht. Ich glaube, dies wird auch in einem überschaubaren Zeitraum der Fall sein, also nicht erst 2050.

Webcode
2771