The TCDH at DHd2025 in Bielefeld
Under Constructions: Humanities and Data Humanities
Date:
03.03.2025 bis 07.03.2025Place:
Bielefeld University
Categories:
ConferenceContact:
Conference WebsiteWhen we look at our world today, we see a world visibly in transition. The experience of global wars, the pandemic, and the urgent need to adapt to real climate change are undoubtedly crisis-laden. Yet, these stand alongside fundamentally transformative global developments, such as datafication, the dismantling of traditional gender roles, and the questioning of established center-periphery models. The sense of "being under construction" is pervasive: society and culture are undergoing profound changes. While this implies uncertainty, it also opens up space for innovation. This year’s conference theme invites scholars to integrate the expertise of the humanities, cultural studies, and data sciences to explore the productive uncertainties of “being under construction.”
TCDH is contributing several presentations to the conference:
- Marina Spielberg will give a talk on „Literary Metaphor Detection with LLM Fine-Tuning and Few-Shot Learning”:
Although there is ample research on natural language metaphor detection, the field of literary metaphor detection is understudied. This paper draws on four English-language datasets and results of Kesarwani et al. (2017), who used traditional machine learning approaches, and shows that Large Language Model (LLM) fine-tuning and few-shot learning with SetFit significantly increases metaphor detection performance in three out of four considered datasets.
- Another talk will be held by Julia Röttgermann, Keli Du and Christof Schöch on the topic „Qualitative Genre-Profile und distinktive Wörter: Eine Studie zu Keyness in Subgenres des französischen Romans”:
Die DHd-Tagung, „Under Construction. Geisteswissenschaften und Data Humanities“ lädt 2025 dazu ein, Daten- und Methoden kritisch zu hinterfragen. Im Trierer Projekt Beyond Words beleuchten wir verschiedene statistische Maße zur Extraktion distinktiver Wörter, mit dem Ziel, mehr über ihren Nutzen und ihre Eigenschaften im Methodenstrauß der Digital Humanities zu erfahren und in unserem Python-Paket ‘pydistinto’ für interessierte Forschende bereitzustellen. In der vorliegenden Studie wenden wir drei verschiedenen Keyness-Maße auf Subgenres des französischen Romans an und untersuchen insbesondere ein Matching zwischen qualitativ erstellen Genre-Profilen und automatisiert extrahierten distinktiven Wortlisten.
- Iuliia Dudar and Christof Schöch will speak in their talk about „Exploring Measures of Distinctiveness: An Evaluation Using Synthetic Texts”:
Measures of distinctiveness are key tools for comparing groups of texts to identify each group's characteristic features. Evaluating these measures is essential for developing this task. In our research, we applied a new method for evaluating measures of distinctiveness. Our method uses a synthetically generated homogenous text corpus to which we insert an artificial word whose frequency and dispersion are precisely manipulated. This approach allows us to determine each measure's sensitivity to variations in frequency and dispersion. Through our evaluation, we uncovered previously unknown characteristics of these measures. Specifically, we discovered that TF-IDF is more sensitive to dispersion variations than other dispersion-based measures. Moreover, we found that Eta cannot detect a word with a clear dispersion contrast when it has the same frequency in both the target and comparison groups. In our next steps, we aim to explore practical applications of this new knowledge about measures of distinctiveness.
Additionally, the following posters will be presented by the TCDH team:
- Marina Spielberg, Claudia Bamberg: „Wie Shakespeare-Übersetzungen digital edieren?”
Das Poster präsentiert den Entstehungs- und Konzeptionsprozess einer digitalen Edition der Shakespeare-Übersetzungen August Wilhelm Schlegels und des Tieck-Kreises (1798 bis 1833), welche derzeit u.a. am Trier Center for Digital Humanities konzipiert wird. Dabei liegt der Fokus auf der Entwicklung eines Datenmodells, den verwendeten Werkzeugen für Transkription und Annotation und dem UX-Design der Nutzeroberfläche. Da bislang wenige Ansätze einer spezifischen Konzeptionalisierung für digitale Übersetzungseditionen vorhanden sind, möchte das Projekt sein entworfenes Konzept auch für künftige Projekte in diesem Bereich nutzbar machen.
- Claudia Bamberg, Jens Bruchertseifer, Thomas Burch, Maria Hinzmann, Susanne Kabatnik, Anne Klee, Jacek Kudera, Claudine Moulin, Hannah Schlimpen, Christof Schöch, Veronica Wassermayr, Joëlle Weis and additional colleagues from the LODinG project: „Baustelle nach Baukastenprinzip: Kontrollierte Vokabulare im Projekt Linked Open Data in den Geisteswissenschaften (LODinG)”
Wie zahlreiche Beiträge u.a. bei Konferenzen wie der DH sowie der DHd belegen, hat sich Linked Open Data (LOD) als Paradigma in den Digital Humanities in den letzten Jahren etabliert. Der Wunsch, Informationen in Projekten in maschinenlesbarer und standardisierter Form zu erfassen, zu modellieren, zu vernetzen, frei zugänglich zu machen und zu analysieren, ist weit verbreitet. In der Realisation des LOD-Paradigmas spielen kontrollierte Vokabulare eine zentrale Rolle, nicht zuletzt, da sie eine Verknüpfung auf der konkreten Entitäten-Ebene voraussetzen bzw. umgekehrt ermöglichen. Der Posterbeitrag verschränkt eine Vorstellung der Teilprojekte des Projekts LODinG. Linked Open Data in den Geisteswissenschaften mit einer Präsentation der jeweils relevanten Vokabulare. Dabei zeigt sich die Vielfältigkeit der Teilprojekte auf der Ebene der Untersuchungsgegenstände, der Forschungsgebiete wie auch der eingesetzten Verfahren, welche wiederum in den verknüpften Vokabularen repräsentiert ist.