Experimente, Evaluierung und Tools
Wintersemester 2018/19
Helmut Schmid



  Termine
    VorlesungDienstag10:00 - 12:00 Uhr c.t., Oettingenstr. 67, 131
    ÜbungenMittwoch14:00 - 16:00 Uhr c.t., Oettingenstr. 67, Rechnerpool Antarktis

  Inhalt der Vorlesung
    Es werden verschiedene Methoden der maschinellen Sprachverarbeitung vorgestellt, darunter Finite-State-Transducer, Naive-Bayes-Modelle, log-lineare Modelle, Conditional-Random-Fields und neuronale Netzwerke. Die Studenten lernen, die beschriebenen Methoden zu implementieren und auf Probleme der maschinellen Sprachverarbeitung anzuwenden.

  Aufgaben
    AufgabeBeschreibungTermin Abgabe bis
    Aufgabe 1Web Crawling und Tokenisierung16. 10. 2018 23. 10. 2018
    Aufgabe 2Morphologie mit Finite-State-Transducern23. 10. 2018 30. 10. 2018
    Aufgabe 3Sentimentanalyse mit Naive Bayes30. 10. 2018 6. 11. 2018
    Aufgabe 4Sentimentanalyse mit log-linearen Modellen6. 11. 2018 13. 11. 2018
    Aufgabe 5Training eines CRF-Wortart-Taggers13. 11. 2018
    Training eines CRF-Wortart-Taggers20. 11. 2018 27. 11. 2018
    Aufgabe 6CRF-Wortart-Tagger II27. 11. 2018 4. 12. 2018
    Aufgabe 7Sentiment-Analyse mit LSTMs4. 12. 2018
    Aufgabe 8Parser (Baumtransformation)18.12.2018 8. 1.2019
    Aufgabe 9Parser (neuronales Netz)8. 1.2019 22. 1.2019
    Aufgabe 10Parser: Parse-Funktion22. 1.2019 31. 1.2019

    zu Aufgabe 6: trainiertes Modell (enthält eine Liste mit tagset, weights, max_substr_len, num_best_tags1, num_best_tags2)

    zu Aufgabe 7: altes Aufgabenblatt

    Pro Aufgabe gibt es maximal 10 Punkte. Die Aufgaben 5 und 9 werden doppelt gewichtet. Die beiden schlechtesten Übungen (bzw. nur Übung 5 oder nur Übung 9, falls eine von diesen am schlechtesten war) werden nicht gewertet.

    Ihre Programme sollten auf den CIP-Pool-Rechnern lauffähig sein, damit ich sie testen kann. Andere Programmiersprachen als Python sind nur nach Absprache erlaubt. Es dürfen nur die Standard-Bibliotheken von Python verwendet werden, außer die Aufgabe erlaubt mehr.


  Begleitmaterial zur Vorlesung
  Benotung
  • bewertet werden die abgegebenen Lösungen zu den Aufgaben nach folgenden Kriterien
Centrum für Informations- und Sprachverarbeitung (CIS)