Statistische Methoden in der Sprachverarbeitung
Wintersemester 2022/23
Dozent: Helmut Schmid



  Termine
    VorlesungMontag12:00 - 14:00 Uhr c.t. Hörsaal BU101
    ÜbungenMontag14:00 - 16:00 Uhr c.t. Raum U151
    RepetitoriumMittwoch12:00 - 14:00 Uhr c.t. Raum C007 ab der 2. Vorlesungswoche
    TutoriumMittwoch19:00 - 21:00 Uhr c.t.online ab der 2. Vorlesungswoche


  Inhalt der Vorlesung

    Das Seminar bietet eine Einführung in wichtige Methoden und Modelle der statistischen maschinellen Sprachverarbeitung und ihre Anwendungen.
    Behandelt werden die Themen:
    • statistische Tests und Kollokationsextraktion
    • Markowmodelle und Sprachidentifizierer
    • Naive Bayes und Wortbedeutungsdesambiguierung
    • Hidden-Markow-Modelle und Wortartannotierung
    • Probabilistische kontextfreie Grammatiken und Parsebaum-Desambiguierung
    • Perzeptron-Algorithmus
    • Conditional Random Fields

  Übungsaufgaben
  Begleitmaterial zur Vorlesung
  Weiterführende Literatur
  • Chris Manning und Hinrich Schütze: Foundations of Statistical Natural Language Processing, MIT Press
  • Daniel Jurafsky and James Martin: Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition, Prentice Hall

  Prüfungstermine
    Übung:??? 2023, ?? Uhr c.t.  
    Vorlesung:  ??? 2023, ??? Uhr c.t.

    Die Vorlesungsklausur wird eine mehrteilige Aufgabe mit 10 von 30 Punkten umfassen, die sich an diesem Beispiel orientiert.

    Die Wiederholungsprüfungen werden im März stattfinden.


Centrum für Informations- und Sprachverarbeitung (CIS)