Mining and Modeling Text – MiMoText

Interdisziplinäre Anwendungen, informatische Weiterentwicklung, rechtliche Perspektiven

Mining and Modeling Text

Projektleitung: Prof. Dr. Christof Schöch  (Universität Trier - Computerlinguistik & Digital HumanitiesUniversität Trier - Trier Center for Digital Humanities (TCDH)) · Universität Trier - Trier Center for Digital Humanities (TCDH)

Projektbeteiligte: Universität Trier - Fachbereich II (Sprach-, Literatur- und Medienwissenschaften) · Universität Trier – Fachbereich IV (Informatikwissenschaften) · Universität Trier – Fachbereich V (Rechtswissenschaft) · Fachinformationsdienst (FID) Romanistik · Universität Trier - Universitätsbibliothek Trier

Förderer: Forschungsinitiative des Landes Rheinland-Pfalz

Laufzeit: -

Ansprechpartner (TCDH): Prof. Dr. Christof Schöch; Prof. Dr. Claudine Moulin

Referenzpublikation:

Schöch, Christof, Frédéric Döhl, Achim Rettinger, Evelyn Gius, Peer Trilcke, Peter Leinen, Fotis Jannidis, Maria Hinzmann, and Jörg Röpke. “Abgeleitete Textformate: Text und Data Mining mit urheberrechtlich geschützten Textbeständen.” Zeitschrift für digitale Geisteswissenschaften (ZfdG) 5 (2020). URL: http://www.zfdg.de/2020_006. DOI: http://dx.doi.org/10.17175/2020_006.

Forschungsbereich(e): Softwaresysteme und Forschungsinfrastrukturen, Digitale Literatur- und Kulturwissenschaften

Schlagworte: quantitative Analysen, Literaturgeschichte, Linked Open Data

Technologie:

Projektseite: Mining and Modeling Text

Die Wissensgewinnung aus großen, nicht mehr durch einzelne Menschen zu bewältigenden Text- und Datenmengen gewinnt durch die Möglichkeiten der Digitalisierung stetig an Bedeutung. Für die Geisteswissenschaften heißt das insbesondere, dass digitale Volltexte und reichhaltige Metadaten nicht nur verfügbar sein müssen, sondern dies auch in einer Form der Fall sein muss, die den geisteswissenschaftlichen Erkenntnisgewinn fördert.

Ziel des Vorhabens MiMoText ist deshalb der Aufbau eines aus unterschiedlichen Quellen gespeisten Informationsnetzwerks für die Geisteswissenschaften, das durch die Bereitstellung als Linked Open Data nicht nur frei verfügbar und mit anderen Wissensressourcen des Semantic Web verknüpfbar ist, sondern auch neuartige und effiziente Zugriffsmöglichkeiten auf fachwissenschaftliche Informationen bietet.
In der ersten Projektphase stehen dabei Quellen zur Geschichte des französischen Romans von 1750 bis 1799 im Fokus, während das Vorgehen in der zweiten Phase auf eine parallele Epoche der deutschen Literaturgeschichte übertragen wird. In beiden Phasen kann auf teils bestehende Volltextdigitalisate aus Gallica, TextGrid und dem VD18 zurückgegriffen werden.

Als Informationsquellen dienen bibliografische Verzeichnisse, Fachliteratur und Primärtexte. Aus diesen werden zunächst Metadaten, konkrete Texteigenschaften und beschreibende oder wertende Aussagen über relevante Entitäten, wie beispielsweise Autoren und Werke, extrahiert. Dafür müssen quantitative Methoden zur automatischen Textanalyse sowie zur Extraktion und Modellierung von Daten aus umfangreichen Textsammlungen weiter- und teils neu entwickelt werden. Anschließend werden die Informationen in ein Linked Open Data-Format überführt und können untereinander sowie nach außen verknüpft werden. Hinzu tritt von Projektbeginn an die Untersuchung rechtlicher Rahmenbedingungen, um die urheber- und datenschutzrechtliche Konformität von Aufbau und Bereitstellung des Wissensnetzwerks gewährleisten zu können.

Sprecher des Vorhabens: schoech [at] uni-trier.de (Prof. Dr. Christof Schöch)
Stellvertretende Sprecherin: moulin [at] uni-trier.de (Prof. Dr. Claudine Moulin)

Team TCDH

Anne Klee
E-Mail: kleeatuni-trier [dot] de
Tel: +49 651 201-3365

Damir Padieu
E-Mail: s2dapadiatuni-trier [dot] de
Tel: +49 651 201-3377

Dr. Maria Hinzmann
E-Mail: hinzmannmatuni-trier [dot] de
Tel: +49 651 201-3101

Johanna Konstanciak
E-Mail: s2jokonsatuni-trier [dot] de
Tel: +49 651 201-3365

Julia Hennemann
E-Mail: hennemannjatuni-trier [dot] de
Tel: +49 651 201-3849

Julia Röttgermann
E-Mail: roettgeratuni-trier [dot] de
Tel: +49 651 201-3120

Leonard Vierbuchen
E-Mail: s2ldvieratuni-trier [dot] de
Tel: +49 651 201-3365

Luchian Pojoni
E-Mail: s4mipojoatuni-trier [dot] de
Tel: +49 651 201-3377

Marte Wulff
E-Mail: s2mawulfatuni-trier [dot] de
Tel: +49 651 201-3377

Moritz Steffes
E-Mail: steffesmatuni-trier [dot] de
Tel: +49 651 201-2679

Prof. Dr. Christof Schöch
E-Mail: schoechatuni-trier [dot] de
Tel: +49 651 201-3264

Prof. Dr. Claudine Moulin
E-Mail: moulinatuni-trier [dot] de
Tel: +49 651 201-2305

Sarah Heintz
E-Mail: s2saheinatuni-trier [dot] de
Tel: +49 651 201-3365

Sarah Ondraszek
E-Mail: s1saondratuni-trier [dot] de
Tel: +49 651 201-3365

Themen