Masterseminar: Klassifikation und Clustering

Wintersemester 2020/21, Zoom-Seminar
Dozent: Stefan Langer

Kurzbeschreibung

Thema des Seminars sind Verfahren für die Klassifikation und das Clustering natürlichsprachlicher Daten. Folgende Inhalte werden erarbeitet:

Weitere Themen können zu Seminarbeginn auf Basis der Interessen der Teilnehmer/innen festgelegt werden.

Scheinkriterien

Voraussetzung für die Scheinvergabe sind:

Material und Literatur

Semesterplan mit Referatsterminen

Folien

Material

Referate


Literatur

Überblickspaper: Kamran Kowsari et al (2019): Text Classification Algorithms: A Survey

Schon etwas älter, enthält aber wesentliche Grundlagen: Chris Manning and Hinrich Schütze (1999): Foundations of Statistical Natural Language Processing, MIT Press. Cambridge MA.

Es gibt einige Einführungen ins maschinelle Lernen, z.B. Miroslav Kubat: An Introduction to Machine Learning. Allerdings gehen diese meist nicht im Detail auf Textklassifikation ein.

Peng Jin, Yue Zhang, Xingyuan Chen, Yunqing Xia(2016): Bag-of-Embeddings for Text Classification. In: IJCAI proceeding, 2016.