Comparo

ein Werkzeug zum modularen Textvergleich

Projektleitung: Prof. Dr. Wolfgang Lukas ( Bergische Universität Wuppertal ) · Prof. Dr. Michael Scheffel ( Bergische Universität Wuppertal ) · Bergische Universität Wuppertal · University of Cambridge

Projektbeteiligte: Deutsches Literaturarchiv Marbach · Arthur-Schnitzler-Archiv an der Universität Freiburg · Cambridge University Library · University College London · University of Bristol

Förderer: Union der deutschen Akademien der Wissenschaften, Arts and Humanities Research Council (AHRC)

Laufzeit: 2012 - 2029

Ansprechpartner (TCDH): Dr. Thomas Burch; Frank Queens

Forschungsbereich(e): Softwaresysteme und Forschungsinfrastrukturen, Digitale Edition und Lexikographie

Schlagworte: digitale Technologien und Werkzeuge, Editionswerkzeug

Technologie:

Java

Projektseite: Zur Projektseite

Comparo ist ein Werkzeug zum synchronen Vergleichen einer nahezu beliebig großen Anzahl von Versionen eines Textes. Die Vergleichseinheit stellt dabei der ‚Satz‘ dar. Da alle Fassungen eines Textes in einer zuvor definierten Reihenfolge gleichzeitig miteinander verglichen werden, ist Comparo ein sehr übersichtliches Werkzeug, mit dem zeiteffizient kollationiert werden kann.

Die Vergleichsparameter sind zudem vom Nutzenden umfassend konfigurierbar, so dass sie auf die jeweilige Textsorte individuell zugeschnitten und bei Bedarf nachjustiert werden können, um auf diese Weise das Vergleichsergebnis zu optimieren (so können beispielsweise auch individuell ‚hochfrequente‘ Wörter definiert werden, die vom Vergleich explizit ausgeschlossen werden sollen). Im Anschluss an den auf Basis der Voreinstellungen automatisch erzeugten Vorschlag kann der Nutzende jede Zuordnung manuell modifizieren, ergänzen oder entfernen. Features wie ‚Lesezeichen‘, ‚Kommentieren‘, ‚Suchen‘, ‚als erledigt markieren‘ sowie unterschiedliche Auswertungsoptionen in übersichtlicher Listenform (z.B. Anzeige aller noch unverbundenen Elemente) steigern zusätzlich die Usability.

Entwickelt am TCDH

Comparo wurde vom TCDH im Rahmen des binationalen Forschungsprojekts „Arthur Schnitzler digital. Digitale historisch-kritische Edition (Werke 1905–1931)“ entwickelt und wird dort zum Erstellen einer ‚Mikrogenese‘-Ansicht verwendet, die sämtliche textgenetisch relevanten Dokumente eines Werks von Arthur Schnitzler in der Reihenfolge ihrer Entstehung in einer einzigen Ansicht nebeneinander anordnet und über die mit Comparo hinterlegten Verbindungen einander entsprechende Sätze in den unterschiedlichen Fassungen parallelisiert. Auf diese Weise entsteht eine hochkomplexe und doch übersichtliche Ansicht sämtlicher Änderungen, die der Text im Laufe seiner Entstehung erfahren hat und beantwortet so nicht nur editionsphilologisch spannende Fragen wie z.B.: Welche Passagen waren im Kern schon in der ersten Skizze eines Werkes vorhanden? Welche Sätze waren zwischenzeitlich an einer anderen Stelle geplant? Welche Sätze sind im Laufe der Textgenese entfallen bzw. neu hinzugekommen und welche sind zwischenzeitlich verworfen und dann restituiert worden? Welche Passagen waren einmal inhaltlich ganz anders geplant (z.B. alternative Enden)? An welchen Stellen hat Schnitzler besonders viel geändert und gefeilt und welche Stellen sind von der ersten Notiz bis zum späteren Druck nahezu unverändert geblieben?

Kombiniert mit FuD

Die in Comparo generierten Informationen werden in einer FuD-Datenbank hinterlegt. Mit Hilfe dieser Datenbasis ist es möglich eine detaillierte Präsentation in Form einer Webansicht zu erarbeiten. In der für das Schnitzler-Projekt erstellen Website können weitere Einstellungen vorgenommen werden, um die Ansicht auf die jeweiligen Bedürfnisse oder Vorlieben des Nutzers anzupassen, so lassen sich beispielweise die Verbindungslinien zwischen den Fassungen oder die Binnenvarianzen nach Bedarf ausblenden. Darüber hinaus kann der Nutzer sich dank der in Comparo hinterlegten Daten hier selbst aussuchen, welche der Dokumente er miteinander vergleichen möchte und auf diese Weise ein individuelles Setting an für seine Forschungsinteresse relevanten Fassungen zusammenstellen.

Bei Comparo handelt es sich um ein in der Programmiersprache Java entwickeltes Werkzeug, welches plattformunabhängig als Java Archiv (JAR) eingesetzt wird. Grundlegend für die Anwendung ist das Vorhandensein einer FuD-Datenbank, welche die zu vergleichenden Textfassungen zur Verfügung stellt und gleichzeitig zum Speichern der erarbeiteten Vergleichsergebnisse verwendet wird.

Zugehörige Projekte: Arthur Schnitzler digital, Transcribo