Angewandtes Programmieren in der Computerlinguistik
Sommersemester 2020
Helmut Schmid



  Kursinhalt
    Am Beispiel ausgewählter computerlinguistischer Aufgabenstellungen erhalten die Studenten die Möglichkeit, ihre praktischen Python-Programmierkenntnisse zu vertiefen.

    Achtung: Wenn Sie diesen Kurs bereits im Bachelorstudium besucht haben, dürfen Sie ihn im Masterstudium nicht noch einmal besuchen.


  Termine
    Der Kurs wird in diesem Jahr als reiner Online-Kurs durchgeführt.

    Sie werden in jeder Woche eine Programmieraufgabe selbständig lösen. Die einzelnen Aufgaben und den jeweiligen Abgabetermin finden Sie unten. Gruppenarbeit ist in diesem Semester nicht erlaubt. Nach der Abgabe erhalten Sie von mir eine Email mit Kommentaren zu Ihrer Lösung. Es gibt pro Übung maximal 10 Punkte. Die Punkte kann ich Ihnen nicht mitteilen, da sonst für die Bachelorstudenten nach Erreichen der Mindestpunktzahl kein Anreiz mehr besteht, weitere Übungen zu bearbeiten.

    Nicht jeder meiner Kommentare zu Ihrer Abgabe bedeutet einen Punkteabzug. Manche sind auch nur ein Hinweis, wie Sie Ihren Code noch lesbarer oder effizienter machen können.

    Wenn bei der Bearbeitung einer Übung Fragen auftauchen, oder wenn Sie bei Ihrer Lösung nicht weiterkommen, wenden Sie sich bitte per Email (schmid@cis.lmu.de) an mich oder schreiben Sie einen Beitrag im Moodle-Forum zu der entsprechenden Aufgabe. Ich werde mich bemühen, Ihre Fragen schnell zu beantworten und Ihnen weiterzuhelfen. Insbesondere während der unten angegebenen Termine, werde ich versuchen, Ihnen sofort zu antworten. Sie sollten gelegentlich einen Blick auf das Moodle-Forum zur aktuellen Aufgabe werfen, um keine wichtigen Informationen zu verpassen. Dazu sollten Sie sich in Moodle zu dem Kurs anmelden.

  • Termin 1
  • Dienstag10 - 12 Uhr
  • Termin 2
  • Mittwoch10 - 12 Uhr c.t.
  • Termin 3
  • Montag12 - 14 Uhr c.t.

    Wenn Sie Fragen zu dem geplanten Kursablauf haben, schreiben Sie mir bitte eine Email.


  Programmierübungen
    ÜbungBeschreibungTermin Abgabe bis
    Übung 1Anagramm-Erkennung und Kompositazerlegung21. 4. 2020 27. 4. 2020
    Übung 2Parsen mit rekursivem Abstieg28. 4. 2020 4. 5. 2020
    Übung 3Verfeinerung von Parsebaumannotationen5. 5. 2020 11. 5. 2020
    Übung 4Earley-Parser und Profiling12. 5. 2020 18. 5. 2020
    Übung 5Buchstaben-Bäume 19. 5. 202025. 5. 2020
    Übung 6Minimierung endlicher Automaten26. 5. 20208. 6. 2020
    vorlesungsfrei2. 6. 2020
    Übung 7Levenshtein-Abstand 9. 6. 2020 15. 6. 2020
    Übung 8Transliteration Mining16. 6. 2020
    Transliteration Mining23. 6. 2020 29. 6. 2020
    Übung 9PyTorch-Tutorial30. 6. 2020
    Übung 10LSTM-Wortart-Tagger Teil 130. 6. 20206. 7. 2020
    Übung 11LSTM-Wortart-Tagger Teil 27. 7. 202013. 7. 2020
    Übung 12LSTM-Wortart-Tagger Teil 314. 7. 202020. 7. 2020

    Pro Übung gibt es maximal 10 Punkte. Übung 8 wird doppelt gewichtet. Es werden nur die 8 besten Abgaben gewertet (wobei hier Übung 8 als zwei Abgaben zählt).

    Es dürfen nur die Standardbibliotheken (math, collections etc.) verwendet werden, sofern in der Aufgabe nicht explizit mehr erlaubt wird. Fragen Sie im Zweifelsfall nach, bevor Sie eine Bibliothek benutzen.

    Ein gutes Programm erfüllt die gestellte Aufgabe korrekt und effizient. Es ist kurz, gut lesbar und überall dort dokumentiert, wo es für das Verständnis des Codes wichtig ist. Variablen und Funktionen sollten aussagekräftige Namen besitzen. Redundanz im Code ist zu vermeiden. Der Code sollte sinnvoll strukturiert sein.

    Bitte schicken Sie Ihre Lösungen per E-Mail-Anhang an schmid@cis.lmu.de.

    Hinweis: In früheren Semestern wurde die Vorlesung dazu genutzt, die Übungsaufgaben gemeinsam zu besprechen und Lösungsansätze zu entwickeln. Die bei jeder Aufgabe aufgelisteten Vorüberlegungen dienten dabei als Denkanstöße. Ich habe nun zusätzlich zu den meisten aufgelisteten Punkten Lösungsansätze skizziert.


  Modulprüfung
    Zum Bestehen des Seminars sind bei Bachelorstudenten mindestens 40 Prozent der möglichen Gesamtpunktezahl aus den Programmieraufgaben erforderlich und bei Masterstudenten 50 Prozent.

  Begleitmaterial