Forschen mit Derivaten

Lösungen für die Bereitstellung von rechtebewehrten Materialien im Netz

Forschen mit Derivaten

Projektleitung: Prof. Dr. Bela Gipp  (Niedersächsische Staats- und Universitätsbibliothek Göttingen) · Prof. Dr. Benjamin Raue  (Universität Trier – Fachbereich V (Rechtswissenschaft)) · Prof. Dr. Thomas Stäcker  (Universitäts- und Landesbibliothek Darmstadt) · Frank Scholze  (Deutsche Nationalbibliothek) · Prof. Dr. Christof Schöch  (Universität Trier - Computerlinguistik & Digital HumanitiesUniversität Trier - Trier Center for Digital Humanities (TCDH))

Förderer: Deutsche Forschungsgemeinschaft (DFG)

Laufzeit: -

Ansprechpartner (TCDH): Prof. Dr. Christof Schöch

Forschungsbereich(e): Digitale Literatur- und Kulturwissenschaften

Schlagworte: digitale Technologien und Werkzeuge, 20th century, 21th century, quantitative Analysen, Textsammlungen, Text Mining

Technologie:

In der modernen Informationsgesellschaft, so die übliche Annahme, führen Digitalisierung und Vernetzung zur Zugänglichkeit immer umfangreicherer Bestände an Daten, Informationen und Wissen. Allerdings gibt es aus unterschiedlichsten Gründen, seien sie technischer, rechtlicher oder gesellschaftlicher Art, auch Grenzen und Beschränkungen dieser Zugänglichkeit, die zu einer signifikanten Unterrepräsentation bestimmter Daten, Informationen und Wissensbeständen führen kann. Im Bereich der rechtlichen Normen ist es insbesondere die Rolle des Urheberrechts, zu einem Interessenausgleich zwischen Urheberrechtsinhabern (wie Autor:innen oder Verlagen) einerseits und den Nutzenden (wie Bürger:innen oder Wissenschaft) beizutragen. Von Einschränkungen betroffen sind hier aus wissenschaftlicher Sicht insbesondere umfangreiche Bestände neuerer Texte. Dies zeigt sich insbesondere bei der begrenzten Verfügbarkeit oder eingeschränkten Nutzbarkeit von Korpora neuerer Forschungsliteratur, Zeitungstexten oder literarischer Texte.

Bisher war aber die Zugänglichkeit dieser Dokumente durch die Regelungen des Urheberrechts – trotz der Reform des Urheberrechts, insbesondere mit der Einführung der TDM-Schranke für die Wissenschaft (§ 60d UrhG) – beschränkt und nur die Nutzung der vollständigen Dokumente vor Ort oder über entsprechende Lizenzen für einen eingeschränkten Nutzendenkreis möglich. Christof Schöch et al. (2020) konnten indes zeigen, dass eine Arbeit mit solchen Materialien in Form abgeleiteter Textformate (ATF) trotz einschränkender urheberrechtlicher Rahmenbedingungen möglich ist, und haben dabei auf das bislang weitgehend ungenutzte Potenzial hingewiesen, welches sich aus der Bereitstellung von abgeleiteten Textformaten für sehr viele Forschungszwecke ergibt, die sich auf die automatische Textauswertung stützen.

Übergeordnetes Ziel des Pilotprojektes ist es, die Möglichkeiten textbasierter Forschung zu urheberrechtlich geschützten Daten durch die Entwicklung und Bereitstellung geeigneter abgeleiteter Textformate (ATF) einen entscheidenden Schritt voranzubringen.

Das TCDH trägt zum Projekt durch die Leitung des Arbeitsbereichs bei, das die Eignung verschiedener ATF evaluiert, sowie durch unterschiedliche Beiträge zu den übrigen Arbeitsbereichen.   

Das Gesamtprojekt gliedert sich in die folgenden vier Schwerpunkte:

  1. Ermittlung und Dokumentation von community-typischen wissenschaftlichen Fragestellungen und Analyseszenarien, die nicht nur mit Volltexten, sondern auch mit Derivaten (ATF) beantwortet werden könnten,
  2. Rechtliche Einordnung unterschiedlicher ATF unter Berücksichtigung von urheberrechtlicher Relevanz, Rekonstruierbarkeit, Wiedererkennbarkeit, in Abhängigkeit auch von Parametern der ATF, 
  3. Evaluierung der Validität bzw. Performanz relevanter Methoden bei Anwendung auf ATF von literarischen und wissenschaftlichen Texten im Vergleich zum Originaltext, sowie Vorschläge für die Dokumentation und persistente Adressierung von ATF sowie zur Nutzung und Zitation im wissenschaftlichen Kontext,
  4. Pilothafte Realisierung, Dokumentation und Veröffentlichung einer Suite von ATF für je einen Bestand literarischer und wissenschaftlicher rechtebewehrter Texte.

So soll zum Abschluss des Projekts eine dokumentierte Übersicht von Derivaten und möglichen Methoden für die betrachteten Anwendungsfälle vorliegen. Diese Übersicht soll rechtlich diskutiert worden sein und für die jeweiligen Fälle Lösungsansätze bieten, um die jeweiligen ATFs rechtssicher zu publizieren. Zwei Pilote sollen die konkrete Anwendbarkeit zeigen und die unterschiedlichen Derivate jeweils im Kontext rechtlich geschützter Daten und freier Referenzkorpora demonstrieren. 

__

Schöch, Christof, Frédéric Döhl, Achim Rettinger, Evelyn Gius, Peer Trilcke, Peter Leinen, Fotis Jannidis, Maria Hinzmann, Jörg Röpke. 2020. „Abgeleitete Textformate: Text und Data Mining mit urheberrechtlich geschützten Textbeständen“. Zeitschrift für digitale Geisteswissenschaften 5. https://doi.org/10.17175/2020_006.

Team TCDH

Prof. Dr. Christof Schöch
E-Mail: schoechatuni-trier [dot] de
Tel: +49 651 201-3264

Zita Baronnet
E-Mail: baronnetatuni-trier [dot] de
Tel: +49 651 201-1302

Themen