Automaten und formale Sprachen
H. Leiß
Inhalt und Ziel der Veranstaltung
Die Vorlesung gibt eine Einführung in die Theorie der formalen Sprachen
und der zu ihrer Erkennung nötigen Automatenmodelle. Der Zusammenhang
zur Semantik von sequentiellen Programmiersprachen wird erläutert.
Damit werden die Grundlagen für eine Beschäftigung mit maschineller
Analyse natürlicher Sprachen gelegt.
Behandelt werden:
- Reguläre Ausdrücke, als Sprachdefinitionen und als iterative
Programme
- Erkennung regulärer Sprachen durch endliche Automaten
- Kontextfreie Grammatiken, als Sprachdefinitionen und rekursive Programme
- Erkennung kontextfreier Sprachen durch Kellerautomaten
- Chomsky's Hierarchie formaler Sprachklassen
- Wiederholungs- und andere Struktureigenschaften kontextfreier Sprachen
- Grundprinzipien der Syntaxanalyse für kontextfreie Grammatiken
Literaturhinweise
Hopcroft / Ullman: Introduction to Automata Theory, Languages and Computation.
Addison Wesley 1979.
N.Moll / M.Arbib / A.J.Kfoury: An Introduction to Formal Language Theory.
Springer-Verlag, 1988.
H.Leiß: Formale Sprachen und Automaten. Vorlesungsskript. München
1997.
Voraussetzungen
Mathematischer Grundkurs oder entsprechende Kenntnisse
Qualifikation
Schein bei aktiver Teilnahme und Lösung von Übungsaufgaben.
Informationsverarbeitung im Internet
F. Guenthner
Inhalt und Ziel der Veranstaltung
Das Internet, speziell das World Wide Web, ist ein Verbund von unzähligen
"Informationsanbietern", die sich als Bündel von sog. Webpages präsentieren.
Es gibt zwei Strukturtypen, die diese Seiten zugänglich machen: die
verschiedenen Formen von "(hyper)links" zwischen den Seiten und die diversen
Webindexe (etwa AltaVista, Lycos, Infoseek, Hotbot, usw.).
Diese Vorlesung gibt einen Überblick über den aktuellen Stand
der Informationsverwaltung im Internet und präsentiert gleichzeitig
einen Versuch, diese zwei Ebenen der Informationsvernetzung über eine
neuartige Form der Dokumentenklassifikation bzw. des Dokumentenclustering
in Verbindung zu setzen.
Literaturhinweise
Eine Bibliographie zu diesem Thema ist ab sofort in der Sprechstunde des
Dozenten erhältlich. (vgl. auch die CIS-Webpage zu diesem Kurs.)
Computerlinguistik I
P. Maier-Meyer
Inhalt und Ziel der Veranstaltung
Ziel dieser Veranstaltung ist es, eine Einführung in die theroetische
Linguistik sowie einen Überblick über die wichtigsten Gebiete
der Computerlinguistik zu geben.
Im Bereich der theoretischen Linguistik werden deren Hauptgebiete und
deren Arbeitstechniken anhand folgender Themenkreise besprochen:
Morphologie und Lexikon: welche Regularitäten sind bei der Formenbildung
zu beobachten und wie werden die sprachlichen Elemente im Lexikon verzeichnet?
Phonologie und Phonetik: wie können sprachliche Laute beschrieben
werden und welchen Regularitäten unterliegen sie, wie ist das Verhältnis
zwischen Lauten und Bedeutung?
Syntax: nach welchen Gesetzmäßigkeiten können Wörter
zu größeren Einheiten bis hin zu Sätzen kombiniert werden?
Semantik: was ist die Bedeutung sprachlicher Einheiten und wie setzt
sich die Bedeutung komplexer Einheiten aus der Bedeutung der Bestandteile
zusammen?
Pragmatik: was spielt außerdem bei der Interpretation von Äußerungen
eine Rolle?
Im Bereich der Computerlinguistik wird anhand einiger typischer Anwendungsprogramme
auf die speziellen Anforderungen in diesem Fach eingegangen.
Literaturhinweise
Grewendorf, G., F. Hamm & W. Sternefeld (1987): Sprachliches Wissen.
Eine Einführung in moderne Theorien der grammatischen Beschreibung.
Homepage:
http://www.cis.uni-muenchen.de/courses/pmaier/CL1/cl1.html
Voraussetzungen
Keine
Qualifikation
Referat und Übungsaufgaben
Erste Sitzung
Do 5.11.98
Korpusbearbeitung für Sprachwissenschaftler
P. Maier-Meyer
Inhalt und Ziel der Veranstaltung
Die Veranstaltung ist speziell fur Sprachwissenschaftler ohne computerlinguistische Vorkenntnisse gedacht, die im Rahmen ihres Studiums oder einer wissenschaftlichen Arbeit mit Textkorpora arbeiten wollen.
Der Kurs beschäftigt sich sowohl mit der Erschließung neuer Datenquellen als auch mit der Auswertung und Bearbeitung vorhandener Korpora. Insbesondere erhalten die Teilnehmer Einblick in die Möglichkeiten der Korpusabfrage am CIS.
Die Teilnahme an dieser Veranstaltung ist Voraussetzung für die selbständige Nutzung der am CIS vorhandenen Korpora.
Literaturhinweise
Tony McEnery & Andrew Wilson: Corpus Linguistics. Edinburgh 1997
Homepage:
http://www.cis.uni-muenchen.de/courses/pmaier/Korpus/planKorpusWS98.html
Voraussetzungen
Es werden keine Programmierkenntnisse vorausgesetzt, etwas Erfahrung im Umgang mit dem Rechner ist jedoch von Vorteil.
Qualifikation
Bearbeitung von Übungsaufgaben
Erste Sitzung
Di 3.11.98
Automaten und formale Sprachen
H. Leiß
Inhalt und Ziel der Veranstaltung
Die Vorlesung gibt eine Einführung in die Theorie der formalen Sprachen
und der zu ihrer Erkennung nötigen Automatenmodelle. Der Zusammenhang
zur Semantik von sequentiellen Programmiersprachen wird erläutert.
Damit werden die Grundlagen für eine Beschäftigung mit maschineller
Analyse natürlicher Sprachen gelegt.
Behandelt werden:
- Reguläre Ausdrücke, als Sprachdefinitionen und als iterative
Programme
- Erkennung regulärer Sprachen durch endliche Automaten
- Kontextfreie Grammatiken, als Sprachdefinitionen und rekursive Programme
- Erkennung kontextfreier Sprachen durch Kellerautomaten
- Chomsky's Hierarchie formaler Sprachklassen
- Wiederholungs- und andere Struktureigenschaften kontextfreier Sprachen
- Grundprinzipien der Syntaxanalyse für kontextfreie Grammatiken
Literaturhinweise
Hopcroft / Ullman: Introduction to Automata Theory, Languages and Computation.
Addison Wesley 1979.
N.Moll / M.Arbib / A.J.Kfoury: An Introduction to Formal Language Theory.
Springer-Verlag, 1988.
H.Leiß: Formale Sprachen und Automaten. Vorlesungsskript. München
1997.
Voraussetzungen
Mathematischer Grundkurs oder entsprechende Kenntnisse
Qualifikation
Schein bei aktiver Teilnahme und Lösung von Übungsaufgaben.
Einführung in die Programmierung
F. Guenthner
Inhalt und Ziel der Veranstaltung
In dieser Veranstaltung werden wir einen Überblick über die Arbeitsweise
von Computern bekommen. Außerdem lernen wir Strategien und Vorgehensweisen
zur Entwicklung von Computerprogrammen. In der Übung werden mit Hilfe
der Strategien Programme geschrieben.
Voraussetzungen
Keine
Computerlinguistik II
M. Emms
Inhalt und Ziel der Veranstaltung
Die Veranstaltung behandelt die grundlegenden Aufgaben der Computerlinguistik
anhand exemplarischer Implementierungen der linguistischen Basismodule:
- Morphologie
- Syntax
- Semantik
- Pragmatik
Der Praxisbezug erfordert eine gute Beherrschung von Prolog und die
Bereitschaft an den Übungen aktiv teilzunehmen.
weitere Information findet man hier
Bemerkung:
Diese Veranstaltung wurde bisher Computerlinguistik genannt und der unterrichtete
Stoff ist der gleiche.
Literaturhinweise:
F.C.N.Pereira, S.M.Shieber: Prolog and Natural Language Analysis, CSLI
Lecture Notes Number 10, 1987, Stanford.
Script "Einführung in die Computerlinguistik"
Voraussetzungen:
Kenntnisse in Prolog
Qualifikation:
Übungen
Einführung in Datenbanken
Ch. Draxler
Inhalt und Ziel der Veranstaltung
Datenbanken erlauben eine anwendungsunabhängige Speicherung von und
einen kontrollierten Zugriff auf sehr große Datenmengen - z.B. Sprachsignale,
Transkriptionen, Lexika.
Dieses Seminar führt anhand praktischer Beispiele aus der Phonetik
und Computerlinguistik in das Gebiet ein:
• Datenmodell, Datenbankentwurf
• Hierarchisches und Netzwerk Datenmodell
• Relationenmodell
Relationenalgebra, -kalkül
Normalisierung
SQL und QBE
Anwendung I: Aussprachelexikon
• Deduktive Datenbanken
Anwendung II: Phonetische Datenbank
• Objekt-orientiertes Datenmodell
• World Wide Web
Literaturhinweise
Zum Seminar erscheint ein Skript im WWW. Literatur wird im Seminar bekanntgegeben.
Voraussetzungen
Bereitschaft zur Arbeit am Computer
Qualifikation
Vortrag und Hausarbeit
Hören
T. Horn
Inhalt und Ziel der Veranstaltung
Ohne Voraussetzung höherer Mathematik bzw. Physik werden einfache
Funktionsmodelle elementarer Hörprozesse erklärt. Wesentliches
Ziel ist das Verständnis der Zeit/Frequenz-Transformation im Innenohr
und der Bildung auditiver Primärgestalten.
Mathematische Grundlagen I
K. Schulz
Inhalt und Ziel der Veranstaltung
Es soll eine Einführung in Teilgebiete der diskreten Mathematik gegeben
werden, die es erleichtert, den formalen Hintergrund anderer Veranstaltungen
im Bereich der Computerlinguistik zu verstehen. Behandelt werden Mengen,
Relationen, Funktionen, Relationalstrukturen und Algebren, insbesondere
Verbände und Boolesche Algebren, sowie Aussagenlogik.
Voraussetzungen
Keine
Qualifikation
Bearbeitung von Übungsaufgaben.
Lexikographie und Morphologie
S. Langer
Inhalt und Ziel der Veranstaltung
Dieses Seminar umfasst die Lehrinhalte der bisherigen Seminare "elektronische
Lexikographie" und "Morphologie". Es gibt eine detaillierte Einführung
in die maschinelle Lexikographie. Die Erstellung, Wartung und Inhalte elektronischer
Wörterbücher werden ebenso behandelt wie Anwendungen elektronischer
Lexika, z.B für die Rechtschreibkorrektur, das Information Retrieval
und die automatische Übersetzung.
Ein besonderer Schwerpunkt liegt auf der lexikographischen Behandlung
der Morphologie des Deutschen. Einige Themenschwerpunkte neben der Morphologie
werden sein:
- Gemeinsamkeiten und Unterschiede zwischen herkömmlichen
Lexika und elektronischen Wörterbüchern
- Extraktion lexikalischer Information aus Korpora
- Semantik im Lexikon
- Anwendungen elektronischer Wörterbücher
- Struktur, Inhalte und Anwendungen des am CIS entwickelten Lexikons
CISLEX
Die Theorie wird ergänzt durch praktische Übungen wie
Verwendung von Unixbefehlen und Programmen zur Korpusverarbeitung; Speicherung
und Verwaltung elektronischer Lexika; Implementierung von Lexikonabfragen.
Literaturhinweise
OOI, Vincent B.Y. (1998): Computer Corpus Lexicography. Edinburgh University
Press.
Qualifikation
Referat mit ausführlichem Begleitpapier und Abgabe von Übungsaufgaben.
Teilnehmer sollten sich möglichst früh mit dem Dozenten wegen
Referatsvergabe in Verbindung setzen.
Die maschinelle Behandlung von Zeitausdrücken
im Deutschen
F. Guenthner
Inhalt und Ziel der Veranstaltung
Das Ziel dieser Veranstaltung ist eine präzise und umfassende algorithmische
Beschreibung aller deutschen Konstruktionen, mit denen man die zeitliche
Lokalisierung von Ereignissen, Handlungen, und Zuständen bestimmen
kann. In erster Linie geht es daher um die lokale Grammatik (und
Semantik) temporaler Adverbialphrasen ("am 30.3.1990", "um drei Uhr", "vier
Stunden später", usw.). Darüberhinaus wird die Frage nach der
temporalen Struktur von einfachen narrativen Texten auch von Interesse
sein.
Literaturhinweise
Eine Bibliographie zu diesem Thema sowie eine Liste von möglichen
Referenten sind ab sofort in der Sprechstunde des Dozenten erhältlich.
(vgl. auch die CIS-Webpage zu diesem Kurs.)
Semantik
K. Schulz
Inhalt und Ziel der Veranstaltung
In diesem Hauptseminar sollen einige weiterführende Arbeiten aus dem
Bereich der Semantik natürlicher Sprache besprochen werden. Die Auswahl
der Themen erfolgt vor dem Hintergrund des Kenntnisstands der Interessenten.
Mögliche Themenfelder sind u.a. Diskursrepräsentationstheorie
und Dynamische Prädikatenlogik, Phänomene der Unterspezifiziertheit
und ihre Behandlung mit Formalismen der höherstufigen Unifikation,
sowie das Gebiet der lexikalischen Funktionen.
Interessenten werden gebeten, sich möglichst frühzeitig,
spätestens jedoch bis Ende September mit Prof. Schulz in Verbindung
zu setzen.
Voraussetzungen
Voraussetzung ist der Besuch der Veranstaltung Semantik I (bzw. Einführung
in die Semantik).
Qualifikation:
Bei Übernahme eines Vortrags kann ein Hauptseminarschein erworben
werden.
Automaten und Transduktoren
H. Leiß
Inhalt und Ziel der Veranstaltung
Es werden einige effiziente Verfahren aus dem Bereich der endlichen Automaten
und Transduktoren behandelt, darunter:
- Aufbau des Indexes aller Teilstrings eines Textes w in O(|w|) Schritten
- Aufbau des Indexes aller Wörter eines Textes w in O(|w|) Schritten
- Minimierung deterministischer endlicher Automaten in O(|Sigma|*|Q|*log|Q|)
Schritten
- Effiziente Suche mit eingeschränkten regulären Mustern
in Strings
- Kombination und Transformationen von Transduktoren
Voraussetzungen
Für die Implementierung wird der Kurs über Standard ML (oder
entsprechende Kenntnisse von SML) benötigt.
Qualifikation:
Seminarvortrag und Implementierung (ggf. paarweise)
Computational Logic
Bry / Schulz
Inhalt und Ziel der Veranstaltung
Es werden Einzelvorträge zu ausgewählten Themen aus den Bereichen
der automatischen Deduktion und Logikprogrammierung gehalten.
Qualifikation
Kein Schein
Kolloquium Computerlinguistik
F. Guenthner / K. Schulz
Inhalt und Ziel der Veranstaltung
In dieser Veranstaltung finden Vorträge zu zentralen Gebieten der
Computerlinguistik statt.
Sprache, Information, Logik (SIL)
Dozenten des SIL-Kollegs
Inhalt und Ziel der Veranstaltung
In diesem Oberseminar tragen Promotionsstudenten und Gäste des Graduiertenkollegs
SIL zu interdisziplinären Themen im Umfeld von Sprache, Information
und Logik vor.
Einführung in Standard ML
H. Leiß
Inhalt und Ziel der Veranstaltung
Die funktionale Programmiersprache Standard ML ist eine getypte Sprache,
die einige Unterstützung bei der Programmierung bietet:
Typsystem:
- Automatische Herleitung von Typen bei der Übersetzung
- Deklaration von freien Datentypen
- Abstrakte Datentypen
Funktionen:
- Höherstufige Funktionen
- Funktionsdefinition durch Fallunterscheidung nach Mustern des Arguments
Imperative Konstrukte:
- referenzierbare Objekte (Zeiger)
- Schleifenkonstrukte
Modulsystem:
- Verpackung von Typen, Objekten und Funktionen in "Strukturen"
- Zusammensetzung von Strukturen durch "Funktoren" zu größeren
Moduln
- Spezifikation und Überprüfung von Schnittstellen zwischen
Moduln
Neuübersetzung nach Programmänderungen: (nur SML’97)
- Automatische Abhängigkeitsanalyse zwischen Moduln
- Automatische Neuübersetzung nur der notwendigen Module
Der Kurs wird neben Beispielen aus dem Buch von Paulson die Konzepte
hauptsächlich an folgenden Beispielen erläutern:
- Übersetzungen zwischen regulären Ausdrücken und endlichen
Automaten
- Berechnung von Eigenschaften und Transformationen kontextfreier Grammatiken
Literaturhinweise
L.C.Paulson: ML for the Working Programmer. 2nd edition. Cambridge University
Press 1996
Einführung in Prolog
N.N.
Inhalt und Ziel der Veranstaltung:
In diesem Kurs wird eine Einführung in die Programmiersprache Prolog
gegeben, deren Kenntnis in dem Kurs Computerlinguistik II vorausgesetzt
wird.
Zeit: Kompaktkurs in den letzten beiden Wochen der Semesterferien
(genaue Zeit: s. Aushang)
Ort: Raum Z11