Experimente, Evaluierung und Tools
Wintersemester 2018/19
Helmut Schmid



  Termine
    VorlesungDienstag10:00 - 12:00 Uhr c.t., Oettingenstr. 67, 131
    ÜbungenMittwoch14:00 - 16:00 Uhr c.t., Oettingenstr. 67, Rechnerpool Antarktis

  Inhalt der Vorlesung
    Es werden verschiedene Methoden der maschinellen Sprachverarbeitung vorgestellt, darunter Finite-State-Transducer, Naive-Bayes-Modelle, log-lineare Modelle, Conditional-Random-Fields und neuronale Netzwerke. Die Studenten lernen, die beschriebenen Methoden zu implementieren und auf Probleme der maschinellen Sprachverarbeitung anzuwenden.

  Aufgaben
    AufgabeBeschreibungTermin Abgabe bis
    Aufgabe 1Web Crawling und Tokenisierung16. 10. 2017 23. 10. 2017
    Aufgabe 2Morphologie mit Finite-State-Transducern23. 10. 2017 30. 10. 2017
    Aufgabe 3Sentimentanalyse mit Naive Bayes30. 10. 2017 6. 11. 2017
    Aufgabe 4Sentimentanalyse mit log-linearen Modellen6. 11. 2017 13. 11. 2017
    Aufgabe 5Training eines CRF-Wortart-Taggers13. 11. 2017
    Training eines CRF-Wortart-Taggers20. 11. 2017 27. 11. 2017
    Aufgabe 6CRF-Wortart-Tagger II27. 11. 2017 4. 12. 2017
    Aufgabe 7PyTorch-Tutorial4. 12. 2017
    Aufgabe 8Sentiment-Analyse mit LSTMs11.12.2018 18. 12.2018
    Aufgabe 9???18. 12.2018 8. 1.2019
    Aufgabe 10???8. 1.2018 15. 1.2018
    Aufgabe 11???15. 1.2018 22. 1.2018
    Aufgabe 12???22. 1.2018 29. 1.2018

    Pro Aufgabe gibt es maximal 10 Punkte. Aufgabe 5 wird doppelt gewichtet. Die beiden schlechtesten Übungen (bzw. Übung 5, falls diese am schlechtesten ist) werden nicht gewertet.

    Ihre Programme sollten auf den CIP-Pool-Rechnern lauffähig sein, damit ich sie testen kann. Andere Programmiersprachen als Python sind nur nach Absprache erlaubt. NLTK darf nicht verwendet werden.


  Begleitmaterial zur Vorlesung
  Benotung
  • bewertet werden die abgegebenen Lösungen zu den Aufgaben nach folgenden Kriterien
Centrum für Informations- und Sprachverarbeitung (CIS)