XML/Web-Technologien

Internationale Standards als Grundlage

Für die im Forschungsprozess entstehenden Daten werden Methoden aus dem Bereich der Web/XML-Technologien eingesetzt, wobei hinsichtlich der Datencodierung der im Bereich der Geisteswissenschaften etablierte Quasi-Standard der TEI-Guidelines verwendet wird. Der konsequente Einsatz dieser Methoden bildet einen zentralen Baustein bzgl. der Gewährleistung der FAIR-Prinzipien von Forschungsdaten.

Standardisierte Auszeichnung

Entscheidend für die langfristige Verfügbarkeit und Benutzbarkeit digitaler Daten ist ihre inhaltlich-strukturelle Erschließung auf Basis eines international anerkannten Standards, wie er mit XML vom W3C definiert wurde. Der Grundgedanke dieser Markupmethode besteht in der strikten Trennung von Inhalt, Struktur und Layout, so dass Daten plattform- und softwareunabhängig gespeichert werden können. Ein XML-codierter Datenbestand erlaubt den gezielten Zugriff auf sämtliche explizit gekennzeichneten Textelemente, ermöglicht die Anreicherung eines Textes mit Meta-Informationen, birgt durch die Internationalisierung ein hohes Vernetzungspotenzial und kann nach dem Prinzip des Single-Source-Publishing als Ausgangsplattform für die unterschiedlichen Publikationsmedien Buch und Internet eingesetzt werden.

Standardisierte Verarbeitung

Verbunden mit dem Einsatz von XML ist die Notwendigkeit einer Verarbeitung der Dokumente verbunden, die ebenfalls plattformunabhängig erfolgen sollte. In dieser Hinsicht stellt XSLT die Lösung dar, da XSLT-Stylesheets als selbst in XML geschriebene Anwendungen  so gut wie problemlos von einer Einsatzumgebung in die andere portierbar sind. In Verbindung mit XPath, einer Adressierungssprache für XML-Dokumente und weiterem Teil innerhalb des XSL-Konzepts, lassen sich generische Verarbeitungsmodule zur Transformation und flexiblen Ansteuerung von XML-Corpora entwickeln.

Standardisierte Präsentation

Die digitale Publikation der Forschungsdaten erfolgt in der Regel im Rahmen von Web-Anwendungen und dem Einsatz von HTML, deren Hauptaufgabe als XML-basierte Auszeichnungssprache wieder darin besteht, eine semantische Beschreibung neben der hierarchischen Struktur des Inhalts zu definieren. Zur Präsentation in einem Web-Browser kommen zusätzlich Cascading Style Sheets (CSS) zum Einsatz.