Automaten und formale Sprachen

H. Leiß

Inhalt und Ziel der Veranstaltung

Die Vorlesung gibt eine Einführung in die Theorie der formalen Sprachen und der zu ihrer Erkennung nötigen Automatenmodelle. Der Zusammenhang zur Semantik von sequentiellen Programmiersprachen wird erläutert.
Damit werden die Grundlagen für eine Beschäftigung mit maschineller Analyse natürlicher Sprachen gelegt.
Behandelt werden:
- Reguläre Ausdrücke, als Sprachdefinitionen und als iterative Programme
- Erkennung regulärer Sprachen durch endliche Automaten
- Kontextfreie Grammatiken, als Sprachdefinitionen und rekursive Programme
- Erkennung kontextfreier Sprachen durch Kellerautomaten
- Chomsky's Hierarchie formaler Sprachklassen
- Wiederholungs- und andere Struktureigenschaften kontextfreier Sprachen
- Grundprinzipien der Syntaxanalyse für kontextfreie Grammatiken

Literaturhinweise

Hopcroft / Ullman: Introduction to Automata Theory, Languages and Computation. Addison Wesley 1979.
N.Moll / M.Arbib / A.J.Kfoury: An Introduction to Formal Language Theory. Springer-Verlag, 1988.
H.Leiß: Formale Sprachen und Automaten. Vorlesungsskript. München 1997.

Voraussetzungen

Mathematischer Grundkurs oder entsprechende Kenntnisse

Qualifikation

Schein bei aktiver Teilnahme und Lösung von Übungsaufgaben.


Informationsverarbeitung im Internet

F. Guenthner

Inhalt und Ziel der Veranstaltung

Das Internet, speziell das World Wide Web, ist ein Verbund von unzähligen "Informationsanbietern", die sich als Bündel von sog. Webpages präsentieren.  Es gibt zwei Strukturtypen, die diese Seiten zugänglich machen: die verschiedenen Formen von "(hyper)links" zwischen den Seiten und die diversen Webindexe (etwa AltaVista, Lycos, Infoseek, Hotbot, usw.).
Diese Vorlesung gibt einen Überblick über den aktuellen Stand der Informationsverwaltung im Internet und präsentiert gleichzeitig einen Versuch, diese zwei Ebenen der Informationsvernetzung über eine neuartige Form der Dokumentenklassifikation bzw. des Dokumentenclustering in Verbindung zu setzen.

Literaturhinweise

Eine Bibliographie zu diesem Thema ist ab sofort in der Sprechstunde des Dozenten erhältlich. (vgl. auch die CIS-Webpage zu diesem Kurs.)


Computerlinguistik I                                                                 

P. Maier-Meyer

 

Inhalt und Ziel der Veranstaltung

Ziel dieser Veranstaltung ist es, eine Einführung in die theroetische Linguistik sowie einen Überblick über die wichtigsten Gebiete der Computerlinguistik zu geben. Im Bereich der Computerlinguistik wird anhand einiger typischer Anwendungsprogramme auf die speziellen Anforderungen in diesem Fach eingegangen.

Literaturhinweise

Grewendorf, G., F. Hamm & W. Sternefeld (1987): Sprachliches Wissen. Eine Einführung in moderne Theorien der grammatischen Beschreibung.

Homepage:

http://www.cis.uni-muenchen.de/courses/pmaier/CL1/cl1.html

Voraussetzungen

Keine

Qualifikation

Referat und Übungsaufgaben

Erste Sitzung

Do 5.11.98


Korpusbearbeitung für Sprachwissenschaftler

P. Maier-Meyer

 

Inhalt und Ziel der Veranstaltung

Die Veranstaltung ist speziell fur Sprachwissenschaftler ohne computerlinguistische Vorkenntnisse gedacht, die im Rahmen ihres Studiums oder einer wissenschaftlichen Arbeit mit Textkorpora arbeiten wollen.
Der Kurs beschäftigt sich sowohl mit der Erschließung neuer Datenquellen als auch mit der Auswertung und Bearbeitung vorhandener Korpora. Insbesondere erhalten die Teilnehmer Einblick in die Möglichkeiten der Korpusabfrage am CIS.
Die Teilnahme an dieser Veranstaltung ist Voraussetzung für die selbständige Nutzung der am CIS vorhandenen Korpora.

Literaturhinweise

Tony McEnery & Andrew Wilson: Corpus Linguistics. Edinburgh 1997

Homepage:

http://www.cis.uni-muenchen.de/courses/pmaier/Korpus/planKorpusWS98.html

Voraussetzungen

Es werden keine Programmierkenntnisse vorausgesetzt, etwas Erfahrung im Umgang mit dem Rechner ist jedoch von Vorteil.

Qualifikation

Bearbeitung von Übungsaufgaben

Erste Sitzung

Di 3.11.98


Automaten und formale Sprachen

H. Leiß

 

Inhalt und Ziel der Veranstaltung

Die Vorlesung gibt eine Einführung in die Theorie der formalen Sprachen und der zu ihrer Erkennung nötigen Automatenmodelle. Der Zusammenhang zur Semantik von sequentiellen Programmiersprachen wird erläutert.
Damit werden die Grundlagen für eine Beschäftigung mit maschineller Analyse natürlicher Sprachen gelegt.
Behandelt werden:
- Reguläre Ausdrücke, als Sprachdefinitionen und als iterative Programme
- Erkennung regulärer Sprachen durch endliche Automaten
- Kontextfreie Grammatiken, als Sprachdefinitionen und rekursive Programme
- Erkennung kontextfreier Sprachen durch Kellerautomaten
- Chomsky's Hierarchie formaler Sprachklassen
- Wiederholungs- und andere Struktureigenschaften kontextfreier Sprachen
- Grundprinzipien der Syntaxanalyse für kontextfreie Grammatiken

Literaturhinweise

Hopcroft / Ullman: Introduction to Automata Theory, Languages and Computation. Addison Wesley 1979.
N.Moll / M.Arbib / A.J.Kfoury: An Introduction to Formal Language Theory. Springer-Verlag, 1988.
H.Leiß: Formale Sprachen und Automaten. Vorlesungsskript. München 1997.

Voraussetzungen

Mathematischer Grundkurs oder entsprechende Kenntnisse

Qualifikation

Schein bei aktiver Teilnahme und Lösung von Übungsaufgaben.



 

Einführung in die Programmierung

F. Guenthner

 

Inhalt und Ziel der Veranstaltung

In dieser Veranstaltung werden wir einen Überblick über die Arbeitsweise von Computern bekommen. Außerdem lernen wir Strategien und Vorgehensweisen zur Entwicklung von Computerprogrammen. In der Übung werden mit Hilfe der Strategien Programme geschrieben.

Voraussetzungen

Keine


Computerlinguistik II

M. Emms

 

Inhalt und Ziel der Veranstaltung

Die Veranstaltung behandelt die grundlegenden Aufgaben der Computerlinguistik anhand exemplarischer Implementierungen der linguistischen Basismodule:
- Morphologie
- Syntax
- Semantik
- Pragmatik
Der Praxisbezug erfordert eine gute Beherrschung von Prolog und die Bereitschaft an den Übungen aktiv teilzunehmen.
weitere Information findet man hier
 

Bemerkung:

Diese Veranstaltung wurde bisher Computerlinguistik genannt und der unterrichtete Stoff ist der gleiche.
 

Literaturhinweise:

F.C.N.Pereira, S.M.Shieber: Prolog and Natural Language Analysis, CSLI Lecture Notes Number 10, 1987, Stanford.
Script "Einführung in die Computerlinguistik"
 

Voraussetzungen:

Kenntnisse in Prolog
 

Qualifikation:

Übungen


Einführung in Datenbanken

Ch. Draxler

 

Inhalt und Ziel der Veranstaltung

Datenbanken erlauben eine anwendungsunabhängige Speicherung von und einen kontrollierten Zugriff auf sehr große Datenmengen - z.B. Sprachsignale, Transkriptionen, Lexika.

Dieses Seminar führt anhand praktischer Beispiele aus der Phonetik und Computerlinguistik in das Gebiet ein:

• Datenmodell, Datenbankentwurf
• Hierarchisches und Netzwerk Datenmodell
• Relationenmodell
    Relationenalgebra, -kalkül
    Normalisierung
    SQL und QBE
    Anwendung I: Aussprachelexikon
• Deduktive Datenbanken
    Anwendung II: Phonetische Datenbank
• Objekt-orientiertes Datenmodell
• World Wide Web

Literaturhinweise

Zum Seminar erscheint ein Skript im WWW. Literatur wird im Seminar bekanntgegeben.

Voraussetzungen

Bereitschaft zur Arbeit am Computer

Qualifikation

Vortrag und Hausarbeit


Hören                 

T. Horn

 

Inhalt und Ziel der Veranstaltung

Ohne Voraussetzung höherer Mathematik bzw. Physik werden einfache Funktionsmodelle elementarer Hörprozesse erklärt. Wesentliches Ziel ist das Verständnis der Zeit/Frequenz-Transformation im Innenohr und der Bildung auditiver Primärgestalten.


Mathematische Grundlagen I

K. Schulz

 

Inhalt und Ziel der Veranstaltung

Es soll eine Einführung in Teilgebiete der diskreten Mathematik gegeben werden, die es erleichtert, den formalen Hintergrund anderer Veranstaltungen im Bereich der Computerlinguistik zu verstehen. Behandelt werden Mengen, Relationen, Funktionen, Relationalstrukturen und Algebren, insbesondere Verbände und Boolesche Algebren, sowie Aussagenlogik.

Voraussetzungen

Keine

Qualifikation

Bearbeitung von Übungsaufgaben.


Lexikographie und Morphologie

S. Langer

 

Inhalt und Ziel der Veranstaltung

Dieses Seminar umfasst die Lehrinhalte der bisherigen Seminare "elektronische Lexikographie" und "Morphologie". Es gibt eine detaillierte Einführung in die maschinelle Lexikographie. Die Erstellung, Wartung und Inhalte elektronischer Wörterbücher werden ebenso behandelt wie Anwendungen elektronischer Lexika, z.B für die Rechtschreibkorrektur, das Information Retrieval und die automatische Übersetzung.
Ein besonderer Schwerpunkt liegt auf der lexikographischen Behandlung der Morphologie des Deutschen. Einige Themenschwerpunkte neben der Morphologie werden sein:
-  Gemeinsamkeiten und Unterschiede zwischen herkömmlichen Lexika und elektronischen Wörterbüchern
-  Extraktion lexikalischer Information aus Korpora
-  Semantik im Lexikon
-  Anwendungen elektronischer Wörterbücher
-  Struktur, Inhalte und Anwendungen des am CIS entwickelten Lexikons CISLEX
Die Theorie wird ergänzt durch praktische Übungen  wie Verwendung von Unixbefehlen und Programmen zur Korpusverarbeitung; Speicherung und Verwaltung elektronischer Lexika; Implementierung von Lexikonabfragen.

Literaturhinweise

OOI, Vincent B.Y. (1998): Computer Corpus Lexicography. Edinburgh University Press.

Qualifikation

Referat mit ausführlichem Begleitpapier und Abgabe von Übungsaufgaben. Teilnehmer sollten sich möglichst früh mit dem Dozenten wegen Referatsvergabe in Verbindung setzen.

Detaillierte Beschreibung des Seminars


Die maschinelle Behandlung von Zeitausdrücken  im Deutschen

F. Guenthner

 

Inhalt und Ziel der Veranstaltung

Das Ziel dieser Veranstaltung ist eine präzise und umfassende algorithmische Beschreibung aller deutschen Konstruktionen, mit denen man die zeitliche Lokalisierung von Ereignissen, Handlungen, und Zuständen bestimmen kann.  In erster Linie geht es daher um die lokale Grammatik (und Semantik) temporaler Adverbialphrasen ("am 30.3.1990", "um drei Uhr", "vier Stunden später", usw.). Darüberhinaus wird die Frage nach der temporalen Struktur von einfachen narrativen Texten auch von Interesse sein.

Literaturhinweise

Eine Bibliographie zu diesem Thema sowie eine Liste von möglichen Referenten sind ab sofort in der Sprechstunde des Dozenten erhältlich. (vgl. auch die CIS-Webpage zu diesem Kurs.)
 


Semantik

K. Schulz

 

Inhalt und Ziel der Veranstaltung

In diesem Hauptseminar sollen einige weiterführende Arbeiten aus dem Bereich der Semantik natürlicher Sprache besprochen werden. Die Auswahl der Themen erfolgt vor dem Hintergrund des Kenntnisstands der Interessenten. Mögliche Themenfelder sind u.a. Diskursrepräsentationstheorie und Dynamische Prädikatenlogik, Phänomene der Unterspezifiziertheit und ihre Behandlung mit Formalismen der höherstufigen Unifikation, sowie das Gebiet der lexikalischen Funktionen.
Interessenten werden gebeten, sich möglichst frühzeitig, spätestens jedoch bis Ende September mit Prof. Schulz in Verbindung zu setzen.

Voraussetzungen

Voraussetzung ist der Besuch der Veranstaltung Semantik I (bzw. Einführung in die Semantik).

Qualifikation:

Bei Übernahme eines Vortrags kann ein Hauptseminarschein erworben werden.


Automaten und Transduktoren

H. Leiß

 

Vorbesprechung und Literatur

Inhalt und Ziel der Veranstaltung

Es werden einige effiziente Verfahren aus dem Bereich der endlichen Automaten und Transduktoren behandelt, darunter:
- Aufbau des Indexes aller Teilstrings eines Textes w in O(|w|) Schritten
- Aufbau des Indexes aller Wörter eines Textes w in O(|w|) Schritten
- Minimierung deterministischer endlicher Automaten in O(|Sigma|*|Q|*log|Q|) Schritten
- Effiziente Suche mit eingeschränkten regulären Mustern in Strings
- Kombination und Transformationen von Transduktoren

Voraussetzungen

Für die Implementierung wird der Kurs über Standard ML (oder entsprechende Kenntnisse von SML) benötigt.

Qualifikation:

Seminarvortrag und Implementierung (ggf. paarweise)


Computational Logic

Bry / Schulz

 

Inhalt und Ziel der Veranstaltung

Es werden Einzelvorträge zu ausgewählten Themen aus den Bereichen der automatischen Deduktion und Logikprogrammierung gehalten.

Qualifikation

Kein Schein


Kolloquium Computerlinguistik

F. Guenthner / K. Schulz

 

Inhalt und Ziel der Veranstaltung

In dieser Veranstaltung finden Vorträge zu zentralen Gebieten der Computerlinguistik statt.


Sprache, Information, Logik (SIL)                                                   Dozenten des SIL-Kollegs

Inhalt und Ziel der Veranstaltung

In diesem Oberseminar tragen Promotionsstudenten und Gäste des Graduiertenkollegs SIL zu interdisziplinären Themen im Umfeld von Sprache, Information und Logik vor.


Einführung in Standard ML

H. Leiß

 

Inhalt und Ziel der Veranstaltung

Die funktionale Programmiersprache Standard ML ist eine getypte Sprache, die einige Unterstützung bei der Programmierung bietet:

Typsystem:
- Automatische Herleitung von Typen bei der Übersetzung
- Deklaration von freien Datentypen
- Abstrakte Datentypen
Funktionen:
- Höherstufige Funktionen
- Funktionsdefinition durch Fallunterscheidung nach Mustern des Arguments
Imperative Konstrukte:
- referenzierbare Objekte (Zeiger)
- Schleifenkonstrukte
Modulsystem:
- Verpackung von Typen, Objekten und Funktionen in "Strukturen"
- Zusammensetzung von Strukturen durch "Funktoren" zu größeren Moduln
- Spezifikation und Überprüfung von Schnittstellen zwischen Moduln
Neuübersetzung nach Programmänderungen: (nur SML’97)
- Automatische Abhängigkeitsanalyse zwischen Moduln
- Automatische Neuübersetzung nur der notwendigen Module

Der Kurs wird neben Beispielen aus dem Buch von Paulson die Konzepte hauptsächlich an folgenden Beispielen erläutern:
- Übersetzungen zwischen regulären Ausdrücken und endlichen Automaten
- Berechnung von Eigenschaften und Transformationen kontextfreier Grammatiken

Literaturhinweise

L.C.Paulson: ML for the Working Programmer. 2nd edition. Cambridge University Press 1996


Einführung in Prolog                                                                                                  

N.N.

Inhalt und Ziel der Veranstaltung:

In diesem Kurs wird eine Einführung in die Programmiersprache Prolog gegeben, deren Kenntnis in dem Kurs Computerlinguistik II vorausgesetzt wird.

Zeit:  Kompaktkurs in den letzten beiden Wochen der Semesterferien (genaue Zeit: s. Aushang)

Ort: Raum Z11