Topic Modeling Workshop

Mining and Modeling Text signet

Datum:

05.05.2020

Ort:

Kategorie(n):

Workshop

Am 12. Mai 2020 von 9:00-12:30 Uhr findet im Rahmen von „Mining and Modeling Text“ ein Workshop zum Thema „Topic Modeling“ statt. Der Workshop wird online stattfinden (über Zoom) und in zwei Sessions geteilt sein, mit einer Erholungspause in der Mitte (also 9:00-10:30 und 11:00-12:30 Uhr). Anlass für den Workshop ist, dass Topic Modeling Teil des Methodenrepertoires in MiMoText sein wird; der Workshop steht aber allen Interessierten offen.

Am 12. Mai 2020 von 9:00-12:30 Uhr findet im Rahmen von „Mining and Modeling Text“ ein Workshop zum Thema „Topic Modeling“ statt. Der Workshop wird online stattfinden (über Zoom) und in zwei Sessions geteilt sein, mit einer Erholungspause in der Mitte (also 9:00-10:30 und 11:00-12:30 Uhr). Anlass für den Workshop ist, dass Topic Modeling Teil des Methodenrepertoires in MiMoText sein wird; der Workshop steht aber allen Interessierten offen.

Topic Modeling ist ein quantitatives Verfahren der Textanalyse, mit dem man in größeren Textbeständen wiederkehrende "Themen" (in einem sehr weiten Sinne) entdecken kann. Die Themen sind dabei als Gruppen von Wörtern modelliert, die immer wieder in ähnlichen Kontexten auftreten und zwischen denen eine semantische Beziehung besteht. Neben den „Word Embeddings“ ist Topic Modeling wohl eine der populärsten Methoden in den Digital Humanities, in denen Prinzipien der distributionellen Semantik zum Tragen kommen.

Der erste Teil des Workshops führt sowohl in die Grundidee des Topic Modeling ein als auch zumindest ein Stück weit in die Statistik, die hinter der Methode steht. Der zweite Teil ist dann praxisorientiert und erläutert, wie Topic Modeling in Python konkret umgesetzt werden kann. Grundkenntnisse in Python oder einer anderen Programmiersprache sind für den zweiten Teil auf jeden Fall hilfreich, aber keine Voraussetzung.

Bitte melden Sie sich bis zum 7. Mai bei Prof. Schöch an, wenn Sie am Workshop teilnehmen möchten. Auch eine Teilnahme nur am ersten Teil ist möglich.

Einige Hinweise vorab:

(1) Die Präsentation zum Workshop ist online verfügbar. Die Folien sind für einen Workshop im Sommer 2019 entstanden und sind auf Englisch, aber
der Workshop wird auf Deutsch stattfinden. Link: https://christofs.github.io/riga/#/ (online, aktueller) oder https://www.dropbox.com/s/kt3w5b8lonywchw/Schoech_2019_Topic-Modeling-Riga.pdf?dl=0 (PDF, Stand Juli 2019).

(2) Für den praktischen Teil ist etwas Vorbereitung notwendig. Hinweise dazu finden sich in dem entsprechenden Github-Repository:
https://github.com/dh-trier/topicmodeling. Dort gibt es einerseits Installationshinweise ("HOWTO"-Datei), außerdem einen Ordner („test“) mit Hinweisen zum Testen der Installation. Bitte installieren Sie Python und alle notwendigen Libraries und testen Sie die Installation vor dem Workshop. Bei Problemen mit der Installation gerne vor dem Workshop per Email melden!