Syntax natürlicher Sprachen
              
2Std.Vorlesung + 2Std.Tafelübung, WS 2015/16

Hans Leiß

Termine

Vorlesung
Di 10-12 Uhr, U 151, Oettingenstr.67
Übung
Mi 14-16, 151, Oettingenstr.67
Tutorin
Anna Wurst
Klausurvorbereitung
Fr. 29.1.2016, 12-14 Uhr, U151
Klausurvorbereitungsfragen von Anna Wurst
Modulprüfung
letzte Semesterwoche, Übungsstunde, d.h.
Mi 3.2.2016, 14-16 Uhr
Ort: 151, Oettingenstr.67
Anmeldung: im LSF, gegen Ende der Vorlesungszeit
Informatik- bzw. Erasmus-Studierende: schicken Sie mir bis Mo 1.2. eine Email
Zweitprüfung
erste Vorlesungswoche des SoSe 2016, Fr 15.4.2016, 16-18 Uhr Oettingenstr.67, Raum 057
27.5.2016: Ergebnisse der Computerlinguisten: im LSF
Ergebnisse der Informatiker: hat Herr Dr.Letz vom Prüfungsamt
Informatiker, die die Korrektur einsehen wollen, können kommende Woche in meinem Büro C110 vorbeikommen. (Die Ankündigung der Klausureinsicht am Mi ging nur über den LSF-Verteiler an die Computerlinguisten.)
Übungsstunden zu Prolog zur Vorbereitung auf die Zweitprüfung (A.Wurst):
Mo, 4.4.2016, 14-16 Uhr, Rechnerraum Kalahari
Prolog-Folien von Anna Wurst
Di, 5.4.2016, 14-16 Uhr, Rechnerraum Kalahari
Do, 7.4.2016, 14-16 Uhr, Rechnerraum Kalahari

Inhalt

Diese Einführung in die Syntax behandelt Grundbegriffe der Grammatik (wie Kongruenz, Rektion und Valenz) und wesentliche syntaktische Konstruktionen des Deutschen im Hinblick auf eine Verwendung in der maschinellen Sprachverarbeitung. Dazu werden die Klassifizierungen von Phrasen, ihre innere Struktur und die zu ihrer Beschreibung verwendeten technischen Hilfsmittel (Formate von Grammatikregeln, Merkmalstrukturen) erklärt und deren Grenzen diskutiert.
In den Übungen soll unter anderem eine Grammatik für deutsche Nominalphrasen und einfache Aussagesätze (mit Objektsätzen) implementiert werden. Dazu wird die symbolische Programmiersprache PROLOG mit dem eingebauten Grammatikformat ,,Definite Clause Grammars'' verwendet.
Vorlesungsfolien:
Übungsaufgaben: erscheinen hier wöchentlich.
Abgabe von Lösungen: jeweils in der folgenden Übungsstunde
Prolog-Programmierung
Wir verwenden die Programmiersprache Prolog, weil Prolog kontextfreie Grammatiken (bzw. eine Verallgemeinerung davon) in ausführbare Programme übersetzt, sodaß wir Grammatikregeln schreiben und Beispiele syntaktisch analysieren können.
Parserprogramm:
  1. einzelne Dateien DCGparser
  2. alle Dateien als Archiv: DCGparser.tgz; auspacken mit: tar -xvfz DCGparser.tgz, im CIP-Raum evtl. mit tar -xvf DCGparser.tgz.
  3. Umrechnung von DCG-Regeln in Prolog-Klauseln: Prolog hat eine solche Umwandlung eingebaut, die jede n-stellige Kategorie der DCG in ein n+2-stelliges Prädikat umwandelt, z.B. np(Kasus) in np(Kasus,I,J). Damit kann man zwar feststellen, ob die Grammatik einen Ausdruck erkennt, z.B. mit ?- np(Kas,[den,alten,'Baum'],J)., bekommt aber keine Syntaxanalyse.
    Ich habe in den von DCGparser/parser.pl automatisch geladenen Dateien eine andere Umwandlung eingebaut, die jede n-stellige Kategorie der DCG in ein n+3-stelliges Prädikat umwandelt, z.B. np(Kasus) in np(Kasus,Syntaxbaum,I,J). Man muß DCGparser/parser.pl laden, bevor man die DCG lädt. Dann funktioniert (auch in Prolog 7.2) die Umwandlung mit Baumausgabe in Textform, d.h. mit ?- parse.
    Wenn man eine DCG lädt, bevor man DCGparser/parser.pl lädt, wird die in Prolog eingebaute Umwandlung benuzt, mit der parse/0 nicht funktioniert. (Sie bekommen dann eine Fehlermeldung, daß z.B. ein Prädikat np/3 definiert sei, aber nicht np/4. In dem Fall sollte man erst DCGparser/parser.pl und dann seine DCG nochmal laden.)
  4. Probleme mit Prolog 7.2 unter MacOS:
  5. Tokenizer: Ich habe DCGparser/tokenizer.mini.pl so geändert, daß parse/1 auf Toplevel verfügbar ist und man eine Datei von Testbeispielen durch ?- parse('np.testbeispiele.txt'). gelesen und syntaktisch analysiert wird. (Man kann sich die Analysen in eine Datei schreiben lassen, wenn man in tokenizer.mini.pl bei der Klausel für parse/1 die drei auskommentierten Zeilen aktiviert.)
    Man sollte sich daher das neue DCGparser/tokenizer.mini.pl vom 19.11. holen!



File translated from TEX by TTH, version 3.67.
On 2 Feb 2016, 10:19.