
Lieferungen an das Deutsche Zeitungsportal
Das Deutsche Zeitungsportal soll den zentralen und nutzerfreundlichen Zugang zu digitalisierten historischen Zeitungen aus Deutschland ermöglichen.
- Machen Sie Ihre digitalisierten Zeitungen einem breiteren Publikum zugänglich.
- Wir helfen Ihnen, neue Nutzergruppen zu erschließen und neue Nutzungsszenarien zu testen.
- Wir unterstützen Sie bei der Metadatenstandardisierung und verbessern so die Austauschbarkeit Ihrer Daten.
Über den allgemeinen Ablauf einer Datenlieferung können Sie sich hier informieren. Für die Lieferung von Zeitungsdaten sind zudem folgende Aspekte zu beachten.
Voraussetzungen
Mit der Zielsetzung, langfristig möglichst alle in Deutschland verfügbaren digitalisierten historischen Zeitungen in einem Portal zu vereinen, ist die Deutsche Digitale Bibliothek beim Aufbau des Zeitungsportals auf die Kooperation mit neuen und bestehenden Datenpartnern angewiesen. Planen Sie ein Digitalisierungsprojekt, an dessen Abschluss die Datenlieferung an das Deutsche Zeitungsportal stehen soll, freuen wir uns über eine frühzeitige Kontaktaufnahme.
Grundsätzlich gelten für die Aufnahme im Deutschen Zeitungsportal die im DFG-Masterplan „Zeitungsdigitalisierung“ (s. Downloads) erarbeiteten Empfehlungen für die Digitalisierung und Erschließung historischer Zeitungen.
Das Deutsche Zeitungsportal unterstützt aktuell nur Zeitungen, deren Metadaten im METS/MODS-XML-Format zur Verfügung stehen. Eine Übersicht und Dokumentation zu den Anforderungen für den Aufbau von Zeitungsausgaben im METS/MODS-XML-Format finden Sie im Wiki der Deutschen Digitalen Bibliothek unter https://wiki.deutsche-digitale-bibliothek.de/pages/viewpage.action?pageId=78512570. Sollten Ihre Daten in einem anderen Format vorliegen, nehmen Sie gerne Kontakt mit uns auf.
Neben der Anforderung, dass die Metadaten in METS/MODS vorliegen müssen, gibt es einige weitere zentrale Voraussetzungen, die die Daten erfüllen müssen:
- Die Bestände müssen über die Zeitschriftendatenbank (ZDB) erfasst sein und über einen entsprechende ZDB-Identifier in den METS/MODS-Daten verfügen. Bei diesem Identifier muss es sich um den Identifier der elektronischen Ausgabe handeln. Über den ZDB-Identifier erfolgt die Verlinkung zwischen dem METS/MODS-Datensatz der Zeitungsausgabe und dem Datensatz der Gesamtaufnahme der elektronischen Ausgabe in der ZDB. Für das Zeitungsportal werden nur die METS/MODS-Datensätze berücksichtigt, die die einzelnen Ausgaben der Zeitungen beschreiben.
- Jede digitale Ausgabe einer Zeitung muss über ein Tagesdatum verfügen, das in den Metadaten gemäß dem ISO-8601-Standard zu erfassen ist. Dieses Datum wird verwendet, um die einzelnen Ausgaben dem richtigen Tag im Kalender des Zeitungsportals zuweisen zu können (s. z. B. https://www.deutsche-digitale-bibliothek.de/newspaper/select/month?year=1852).
- Die Bilddateien (Scans der Zeitungen) müssen in den Dateiformaten JPEG File Interchange Format, Portable Network Graphics (PNG) oder Tagged Image File Format (TIF) geliefert werden. Die Bilder sollen in der größtmöglichen Auflösung geliefert werden, mindestens jedoch in der Größe von 800x600 Pixeln.
- Falls Volltexte mitgeliefert werden, müssen diese als ALTO-XML vorliegen. ALTO steht für Analyzed Layout and Text Object und ist ein standardisiertes XML-Format zur Speicherung von Layout- und Inhaltsinformationen eines Digitalisats. ALTO speichert Layout-Informationen und via OCR (Optical Character Recognition) erkannten Text von Seiten jeglicher Art von gedruckten Dokumenten (z.B. Zeitungen). Dabei kommt die Angabe von (pixel-basierten) Koordinaten für die Wörter auf einer Seite zur Anwendung. Dies ermöglicht später im DDB-Viewer die farbliche Hervorhebung gefundener Treffer, auf die der Volltext durchsucht wurde. Hier finden Sie weiterführende Informationen zu Struktur und Aufbau von ALTO-Dateien für das Deutsche Zeitungsportal.
Technische Anforderungen
Die Fachstelle Bibliothek übernimmt das Harvesting Ihrer Zeitungsdaten über eine von Ihnen betriebene OAI-PMH-Schnittstelle. Idealerweise haben Sie dazu auf Ihrer Schnittstelle ein Set eingerichtet und teilen der Fachstelle den entsprechenden Code des Sets mit. Sollten Sie über keine OAI-Schnittstelle verfügen, nehmen Sie zur Abstimmung individueller Lieferwege (z.B. als Dump) bitte Kontakt mit der Fachstelle auf.
Die zu einer Zeitungsausgabe gehörenden Dateien (ALTO- und Bild-Dateien) werden im Regelfall durch den Binaries Service des FIZ Karlsruhe von Ihrem Server heruntergeladen. Der Binaries Service ist dazu ausgelegt, die zum Teil großen Datenmengen möglichst schnell herunterzuladen, ohne dabei die Funktionsweise des Servers, von dem heruntergeladen wird, zu beeinträchtigen. Bei sehr ressourcenschwachen oder schlecht angebundenen Servern kann es dennoch zu kurzfristigen Beeinträchtigungen kommen. Bitte lassen Sie uns vorab wissen, falls Ihr Server Probleme mit dem Herunterladen von großen Datenmengen haben könnte. Ihr Server sollte kein Rate-Limiting implementiert haben und idealerweise eTag- und Last-Modified-Header mitsenden, um ein wiederholtes Herunterladen zu vermeiden.
Das Zeitungsportal der Deutschen Digitalen Bibliothek gewährt zu Zwecken der Wissenschaft, Forschung und Lehre sowie zur staatsbürgerlichen Aufklärung und transparenten Aufarbeitung der NS-Diktatur Zugang zu Presseerzeugnissen aus der Zeit des Nationalsozialismus.
Alle Zeitungsausgaben, die nach der NS-Machtergreifung und vor Kriegsende erschienen sind, werden von der DDB automatisch mit einem Disclaimer versehen, in dem sich die DDB ausdrücklich von allen rassistischen, antisemitischen und weiteren diskriminierenden Inhalten sowie von gewaltverherrlichenden und propagandistischen Darstellungen distanziert. Der Disclaimer muss von Nutzenden aktiv zur Kenntnis genommen werden, bevor die Inhalte angezeigt werden.
Sollten Ihre Bestände NS-Presse, z.B. Parteizeitungen, enthalten, die schon vor 1933 erschienen ist, informieren Sie uns bitte (s. Fallbeispiel).
Anhand eines Fallbeispiels möchten wir Ihnen aufzeigen, wie auch Ihre Zeitungen Teil des Deutschen Zeitungsportals werden können.
Gehen wir für unseren Fall davon aus, dass Ihre Einrichtung historische Zeitungen digitalisiert hat und diese über das Deutsche Zeitungsportal ihren Nutzer*innen zur Verfügung stellen möchte. Die Metadaten der Zeitungen liegen in METS/MODS-XML vor.
Formaler und inhaltlicher Vorlauf
Im ersten Schritt muss sich Ihre Einrichtung bei der Deutschen Digitalen Bibliothek unverbindlich über das Registrierungsportal anmelden. Der Registrierungsvorgang erfolgt in wenigen Schritten und dauert nur 5–10 Minuten. Nachdem die Servicestelle der Deutschen Digitalen Bibliothek den Eintrag geprüft hat, erscheint Ihre Einrichtung auf der Kulturlandkarte und erhält eine eigene Institutionenseite. Bei der Registrierung ist es wichtig anzugeben, ob Ihre Einrichtung bereits einen ISIL hat. Sollte kein ISIL vorhanden sein, muss dieser beantragt werden.
Nach der Registrierung muss Ihre Einrichtung mit der Deutschen Digitalen Bibliothek einen Kooperationsvertrag schließen. In diesem wird die Übergabe der Rechte an den Metadaten geklärt.
Für alle Fragen rund um Ihre Datenlieferung steht Ihnen - auch bereits vor dem Abschluss des Kooperationsvertrages - die Fachstelle Bibliothek zur Verfügung. Bei Ihrer ersten Datenlieferung könnte es sich bspw. um einen Bestand von 10.000 historischen Zeitungsausgaben handeln. Bei der Digitalisierung der Zeitungsausgaben haben Sie eine Volltext-Erfassung durchgeführt, die Volltext-Dateien liegen als ALTO-XML vor. Die Metadaten liegen in METS/MODS-XML vor, da dies das von der DFG für digitalisierte Dokumente vorgeschriebene Exportformat ist. Die Daten sollen über eine OAI-Schnittstelle geliefert werden.
Nach Klärung der Formalia und der grundlegenden Fragen zu den Lieferdaten kann die eigentliche Arbeit beginnen.
Datenclearing
Ihre Daten werden von der Fachstelle Bibliothek der Deutschen Digitalen Bibliothek über Ihre OAI-PMH-Schnittstelle geharvestet. Im Idealfall haben Sie zu diesem Zweck ein Set auf Ihrer Schnittstelle eingerichtet, in dem die infrage kommenden Zeitungsdaten enthalten sind. Bei Fehlen einer OAI-Schnittstelle stimmen wir gemeinsam einen individuellen Lieferweg ab.
Im Folgenden werden die Daten von der Fachstelle Bibliothek abgerufen, vorprozessiert und analysiert. Danach erhalten Sie einen Analysereport für die Datenlieferung, in dem mögliche Fehler und alle betroffenen Datensätze so erfasst sind, dass eine Korrektur der Datensätze erleichtert wird.
In der Validierung der Fachstelle Bibliothek werden verschiedene Fehlerlevel unterschieden, nur das “rote” Fehlerlevel verhindert eine Weiterprozessierung der Daten. Einige Anpassungen an den Daten können automatisiert durch die Fachstelle vorgenommen werden, andere Abweichungen der Daten von dem Anwendungsprofil für Zeitungen der Deutschen Digitalen Bibliothek führen u. U. einfach dazu, dass Elemente nicht oder leicht abgeändert im Deutschen Zeitungsportal angezeigt werden.
Datenlieferung
Die Daten, die die Validierung passiert haben, werden weiterprozessiert und ins Testsystem des Zeitungsportals geladen. Die Fachstelle Bibliothek prüft die Umsetzung und hält bei Unklarheiten Rücksprache mit Ihrer Einrichtung. Sie haben auch die Möglichkeit, sich Ihre Daten selbst im Testsystem anzusehen und freizugeben.
Sollten Ihre Zeitungsbestände Ausgaben aus der NS-Zeit enthalten, so werden diese automatisch mit einem Disclaimer versehen, in dem sich die DDB ausdrücklich von allen rassistischen, antisemitischen und weiteren diskriminierenden Inhalten sowie von gewaltverherrlichenden und propagandistischen Darstellungen distanziert. Der Disclaimer wird automatisch anhand des Tagesdatums erzeugt.
Sollten Ihre Bestände allerdings explizite NS-Zeitungen enthalten, die schon vor der NS-Machtergreifung am 30. Januar 1933 erschienen sind (z.B. Titel wie “Der Führer”), teilen Sie uns dies bitte mit, sobald Sie uns Ihre Daten liefern. In diesen Fällen werden die entsprechenden Zeitungsausgaben von der Fachstelle Bibliothek gekennzeichnet, um sicherzustellen, dass auch Ausgaben vor dem 30. Januar 1933 mit dem Disclaimer versehen werden.
Auch im gegenteiligen Fall - Sie liefern Zeitungen, die zwar in der NS-Zeit erschienen sind, aber nicht der Gleichschaltung durch die Nationalsozialisten unterlagen, z.B. Exilzeitungen wie den “Aufbau”, - teilen Sie uns dies bitte bei der Lieferung mit. Auch hier werden die Daten zu den Zeitungsausgaben entsprechend gekennzeichnet, um das Schalten des Disclaimers zu verhindern.
Für die abschließende Qualitätssicherung ist die Servicestelle der Deutschen Digitalen Bibliothek zuständig. Sie überprüft noch einmal, ob alle Anforderungen der Deutschen Digitalen Bibliothek erfüllt worden sind. Nach der Freigabe durch die Servicestelle sind Ihre Zeitungsdaten im Deutschen Zeitungsportal sichtbar.
Nachdem Ihre Zeitungen im Deutschen Zeitungsportal freigeschaltet worden sind, bitten wir Sie schließlich noch darum, in den ZDB-Datensätzen der entsprechenden Zeitungen einen Link auf den Bestand im Deutschen Zeitungsportal zu setzen (mehr Informationen dazu s. hier).
Nach der ersten Lieferung von Daten klärt die Fachstelle Bibliothek schließlich noch mit Ihnen ab, ob und in welchem Rhythmus Update-Lieferungen erfolgen sollen.
Downloads & Links
Wenn Sie noch weitere Fragen haben, melden Sie sich bitte bei der Fachstelle Bibliothek der Deutschen Digitalen Bibliothek.