Das Centrum für Informations- und Sprachverarbeitung (CIS) befindet sich im Gebäudekomplex der Institute am Englischen Garten, Flügel B, 1. Stock. Adresse: Oettingenstr. 67, 80538 München. Tel: (089)2180-9721; FAX: (089) 2180-9701 Das Sekretariat ist für Studenten vormittags von 10-12 geöffnet.
Veranstaltungsbeginn und Räume
Die Veranstaltungen beginnen in aller Regel in der ersten Semesterwoche. Abweichungen davon werden rechtzeitig ausgehängt. Falls nicht anders angegeben finden die Veranstaltungen im Gebäude an der Oettingenstraße statt.
Vorlesungsverzeichnis im WWW
Das kommentierte Vorlesungsverzeichnis kann auch unter folgender Adresse im WWW eingesehen werden: http://www.cis.uni-muenchen.de/kurse
Nachbardisziplinen
Hingewiesen wird auch auf die Veranstaltungen des Instituts für Informatik, des Instituts für Philosophie, Logik und Wissenschaftstheorie (Ludwigstr.31), des Instituts für Phonetik und Sprachliche Kommunikation (Schellingstr.3) und schließlich auf die Veranstaltungen zur theoretischen Linguistik des Instituts für Deutsche Philologie (Schellingstr.3).
Hinweis
In diesem Semster findet erneut die Übung Technik des wissenschaftlichen Arbeitens statt. Hauptfachstudenten, die ihr Studium im Winter 2002 oder später aufgenommen haben, sind verpflichtet, vor dem Beginn des Hauptstudiums diese Übung einmal erfolgreich zu absolvieren. Studienanfängern wird die Teilnahme an der anschließenden UNIX-Übung nahegelegt.
Fachschaft
Die Fachschaft Computerlinguistik, die selbstverwaltete Interessenvertretung der Studenten am Institut, ist unter http://www.cis.uni-muenchen.de/studenten/fachschaft zu erreichen. Kommilitonen, die sich für die Belange der Computerlinguistikstudenten engagieren wollen, sind herzlich willkommen.
Studienberatung
Die Studienberatung findet (nach Voranmeldung) in den Sprechstunden von Prof.Dr.Guenthner und Prof.Dr.Schulz statt. Ferner stehen alle Dozenten gerne zur Beratung zur Verfügung:
Vorlesung
Zeit und Raum: Di. 8-10, Raum 1.31 (Nähere Einzelheiten, Skriptum etc.)
Inhalt und Ziel der Veranstaltung
Es werden zuerst die klassischen Verfahren zur Syntaxanalyse mit kontextfreien Grammatiken behandelt: Top-Down-Analyse, Bottom-Up-Analyse, Left-Corner-Analyse und Tabellengesteuerte Analyse.
Dann wird besprochen, wie man solche allgemeinen Verfahren zu einem effizienteren Parser für eine bestimmte Grammatik spezialisiert, indem man automatisch Eigenschaften der Grammatik berechnet und im Parser ausnutzt.
Schließlich sollen Varianten dieser Verfahren für Grammatiken mit Merkmalen (DCGs) und die Verwendung von Metaregeln zur Angabe einer größeren Grammatik behandelt werden.
Literatur
Voraussetzungen
Programmierkenntnisse in Prolog, Definite Clause Grammars.
Hinweis: Teilnehmer des Hauptseminars ,,Satzgrammatik'' sollten diese Vorlesung besuchen, da die hier erklärten Techniken im Hauptseminar benutzt werden.
Proseminarvorlesung
Zeit und Raum: Mo. 10-12, Raum 0.05 und Mi. 10-12, Raum 0.05;
Inhalt und Ziel der Veranstaltung
In dieser Veranstaltung werden Sie einen Überblick über die Arbeitsweise von Computern bekommen. Außerdem lernen wir Strategien und Vorgehensweisen zur Entwicklung von Computerprogrammen. Die Vorlesung gibt auch einen Überblick über verschiedene Programmiersprachen wie, C, JAVA, C++, Perl und Prolog. In der Übung werden kleine Programme selbst geschrieben.
Voraussetzungen
keine
Teilnahmebedingungen
Aktive Mitarbeit
Scheinkriterien
Aktive Teilnahme, Bearbeitung von Übungsaufgaben, Klausur
Proseminarvorlesung
Zeit und Raum: Mo. 14-16, Raum 1.35 und Mi. 12-14, Raum 0.33
Diese Veranstaltung wendet sich an StudentInnen mit Programmierkenntnissen in C.
Ziel dieses Rechnerpraktikums ist es ein Programmsystem zur entwickeln,
das die Kookurenzen von Wörtern in Texten berechnen kann. Die zentrale
Frage lautet: "Welches Wort kommt mit welchen Wort vor".
Zur Entwicklung des Programms sind Techniken der effizienten Speicherung
notwendig, die im ersten Teil der Veranstaltung gelehrt werden.
Im zweiten Teil der Veranstaltung werden einzelne Module für das
Programm entwickelt, die dann im dritten Teil der Veranstaltung zusammengebunden
werden um dann die Kookurrenz zu berechnen.
Voraussetzungen
Es werden fortgeschrittene Kenntnisse der Programmiersprache C vorrausgesetzt..
Scheinkriterien
Für die erfolgreiche Programmierung der Aufgabe in einer Arbeitsgruppe gibt es einen Proseminarschein bzw. bei umfangreicher Programmierung einen Hauptseminarschein bei Prof. Guenthner.
Proseminarvorlesung
Zeit und Raum: Mo. 8-10, Raum 0.05 und Do. 16-18, Raum 1.27
Inhalt und Ziel der Veranstaltung
Die Veranstaltung behandelt die grundlegenden Aufgaben der Computerlinguistik anhand einer exemplarischen Implementierung der linguistischen Basismodule:
Am Ende des Semesters werden wir ein natürlichsprachliches Generierungs- und Analyse-System für einen kleinen Sprachausschnitt in Prolog implementiert haben. Der Praxisbezug erfordert mindestens Grundkenntnisse in Prolog und die Bereitschaft an den Übungen aktiv teilzunehmen.
Literatur
Voraussetzungen
Kenntnisse in Prolog. Teilnehmer ohne Grundkenntnisse in Prolog bitte rechtzeitig beim Dozenten melden.
Scheinkriterien
Übungen
K.Schulz
Proseminarvorlesung
Zeit und Raum: Mo. 12 -14 , Raum 1.27 und Do. 14-16, Raum 1.27
Inhalt und Ziel der Veranstaltung
Es wird eine Einführung in Teilgebiete der diskreten Mathematik gegeben, die es erleichtert, die formalen Grundlagen anderer Veranstaltungen im Studiengang Computerlinguistik zu verstehen. Behandelt werden
Literatur
Voraussetzungen
Keine
Scheinkriterien
Proseminarschein bei erfolgreicher Bearbeitung von Übungsaufgaben und Klausur.
Proseminar
Zeit und Raum: Mi. 12-14, Raum 0.37, Do. 14-16, Raum Arktis
Inhalt und Ziel der Veranstaltung
Dieser Kurs richtet sich speziell an Studenten des Aufbaustudiengangs ,,Computerlinguistik''. Im Rahmen dieser Einführung werden die formalen Grundlagen und elementaren Arbeitstechniken er Computerlinguistik in Theorie und Praxis vermittelt. Im Theorieteil geht es vor allem um die mathematischen Grundlagen:
Im Praxisteil lernen die Teilnehmer die Anwendung von verschiedenen Unix-Tools und der Skriptsprache Perl zur Lösung elementarer Aufgaben in der Computerlinguistik.
Literatur
Voraussetzungen
keine
Scheinkriterien
Übungsaufgaben und Klausur
Proseminarvorlesung
Zeit und Raum: Di. 18-20, Raum 1.14 und Do. 12-14, Raum 0.05
Inhalt und Ziel der Veranstaltung
In diesem Seminar geht es zunächst um die Vermittlung vertiefter Kenntnisse der Flexions- und Wortbildungsmorphologie. Nach einem knappen Überblick über die verschiedenen Wortbildungsverfahren im Deutschen und anderer Sprachen werden wir uns mit den Problemen einer theoretisch angemessenen Erfassung der Daten befassen. Neben den klassischen Konzeptionen (I&A, I&P, W&P) werden dabei vor allem Modelle, die in der CL relevant sind (Finite-State-Morphology, Two-Level-Morphology) behandelt. Der zweite Schwerpunkt des Seminars ist die maschinelle Lexikographie, wobei es ein zentrales Thema sein wird, wie morphologische, syntaktische und semantische Eigenschaften von Wörtern in einem elektronischen Lexikon repräsentiert werden können. Themen werden hier unter anderem sein:
Teilnahmebedingungen
Aktive Mitarbeit, Übungen und Referat
Scheinkriterien
Aktive Mitarbeit, Übungen, Referat und Klausur
Proseminarvorlesung (Skriptum und Übungsaufgaben)
Zeit und Raum: Di. 16-18, Raum 1.27, Do. 10-12, Raum 0.05
Inhalt und Ziel der Veranstaltung
Die Vorlesung gibt eine Einführung in die Theorie der formalen Sprachen und der zu ihrer Erkennung nötigen Automatenmodelle. Der Zusammenhang zur Semantik von sequentiellen Programmiersprachen wird erläutert. Damit werden die Grundlagen für eine Beschäftigung mit maschineller Analyse natürlicher Sprachen gelegt. Behandelt werden:
Literatur
Voraussetzungen
Mathematischer Grundkurs oder entsprechende Kenntnisse
Scheinkriterien
Schein bei aktiver Teilnahme und Lösung von Übungsaufgaben.
Proseminarvorlesung
Zeit und Raum: Mi. 8 - 10 , Raum 1.14 und Fr. 8-11, Raum 1.14
Inhalt und Ziel der Veranstaltung
Ziel dieser Veranstaltung ist es, eine Einführung in die theoretische Linguistik sowie einen Überblick über die wichtigsten Gebiete der Computerlinguistik zu geben. Im Bereich der theoretischen Linguistik werden deren Hauptgebiete und deren Arbeitstechniken anhand folgender Themenkreise besprochen: Morphologie und Lexikon: welche Regularitäten sind bei der Formenbildung zu beobachten und wie werden die sprachlichen Elemente im Lexikon verzeichnet? Phonologie und Phonetik: wie können sprachliche Laute beschrieben werden und welchen Regularitäten unterliegen sie, wie ist das Verhältnis zwischen Lauten und Bedeutung? Syntax: nach welchen Gesetzmäßigkeiten können Wörter zu größeren Einheiten bis hin zu Sätzen kombiniert werden? Semantik: was ist die Bedeutung sprachlicher Einheiten und wie setzt sich die Bedeutung komplexer Einheiten aus der Bedeutung der Bestandteile zusammen? Pragmatik: was spielt außerdem bei der Interpretation von Äußerungen eine Rolle? Im Bereich der Computerlinguistik wird anhand einiger typischer Anwendungsprogramme auf die speziellen Anforderungen in diesem Fach eingegangen.
Literatur
Grewendorf, G., F. Hamm & W. Sternefeld (1987): Sprachliches Wissen. Eine Einführung in moderne Theorien der grammatischen Beschreibung.
Voraussetzungen
Keine
Scheinkriterien
Referat, Übungsaufgaben und Klausur
Proseminarvorlesung
Zeit und Raum: Mo. 16-18, Rechnerraum Arktis, Fr. 14-16, Rechnerraum Arktis
Inhalt und Ziel der Veranstaltung
Es sollen vorhandene Kenntnisse vertieft und Themen der fortgeschrittenen Perl-Programmierung vermittelt werden, insbesondere die Nutzung vorhandener Perl-Module. Einige der geplanten Themen (noch nicht verbindlich):
Literatur
Voraussetzungen
Schein in 'Korpus- und Unix-Tools' oder vergleichbare Kenntnisse
Scheinkriterien
Der Erwerb eines Proseminarscheins setzt die regelmäßige Bearbeitung und der Programmieraufgaben voraus.
Proseminar
Zeit und Raum: Do. 8-10, Raum 1.39
Inhalt und Ziel der Veranstaltung
Datenbanken erlauben eine anwendungsunabhängige Speicherung von und einen kontrollierten Zugriff auf sehr große Datenmengen - z.B. Sprachsignale, Transkriptionen, Lexika. Dieses Seminar führt anhand praktischer Beispiele aus der Phonetik und Computerlinguistik in das Gebiet ein:
Literatur
Zum Seminar erscheint ein Skript im WWW. Literatur wird im Seminar bekanntgegeben.
Voraussetzungen
Bereitschaft zur Arbeit am Computer
Scheinkriterien
Vortrag und Hausarbeit
Proseminar
Zeit und Raum: Do. 10-12, Rechnerraum Arktis
Inhalt und Ziel der Veranstaltung
Java ist eine moderne objektorientierte und plattformunabhängige Programmiersprache, die sowohl zur Programmierung von eigenständigen Applikationen als auch von Applets, das sind Programme, die innerhalb eines WWW-Browsers laufen, verwendet wird.
Der Javakurs besteht aus zwei Teilen: eine Einführung ins Programmieren in Java im Wintersemester, und fortgeschrittenes Programmieren in Java im Sommersemester.
Themen im Wintersemester sind: objektorientiertes Programmieren, elementare Programmierkonstrukte wie Schleifen, Fallunterscheidungen und Rekursion sowie der Aufbau eigener Datenstrukturen und elementare Ein- und Ausgabe. Themen des Sommersemesters sind grafische Oberflächen, Multimedia, das WWW sowie Datenbankzugriffe von Java aus.
Die Programmierbeispiele stammen größtenteils aus dem Bereich der Phonetik bzw. Linguistik. Im Kurs stelle ich Programmfragmente vor, die in eigener Arbeit dann vervollständigt werden müssen.
Literatur
Voraussetzungen
Programmiererfahrung in einer anderen Programmiersprache wünschenswert, selbstständiges Arbeiten während der Woche.
Scheinkriterien
auf Wunsch stelle ich einen Teilnahmeschein aus. Einen Schein mit Leistungsnachweis gibt es für ein selbstständig ausprogrammiertes Anwendungsprogramm.
F. Guenthner
Proseminar
Zeit und Raum: Mi. 14 -16 , Raum 1.13
Inhalt und Ziel der Veranstaltung
Das Seminar widmet sich der Erstellung von morphologischen Lexika für Sprachen mit komplexen Alphabeten. Im wesentlichen werden die verschiedenen Arbeitsgruppen am CIS ihre bisherige Arbeit systematisch vorstellen. Die ersten Sitzungen des Seminars beschäftigen sich mit einer Einführung in Unicode und verwandten Aspekten sowie in das Unitex-System. Im Anschluß sollen folgende Sprachen werden behandelt:
Voraussetzungen
Anmeldung beim Dozenten während der Semesterferien ist erforderlich
Scheinkriterien
Referat und Hausarbeit
Proseminar
Zeit und Raum: Do. 16-18, Raum 1.15
Inhalt und Ziel der Veranstaltung
Sprachakustik befaßt sich mit der Wahrnehmung, Erzeugung, Übertragung und Verarbeitung von Sprachschall aus psychologischer, physiologischer, physikalischer und technischer Sicht.
Der Kurs gibt eine allgemeinverständliche Einführung, indem einige hundert grundlegende Fachbegriffe möglichst anschaulich und beispielreich erläutert werden, im Sinne einer didaktisch geordneten Enzyklopädie.
Teilnahmebedingungen
keine
Scheinkriterien
kurze mündliche Prüfung
F. Guenthner
Hauptseminar
Zeit und Raum: Di. 10 -12 , Raum 1.13
Inhalt und Ziel der Veranstaltung
Vertikale Suchmaschinen sind Suchmaschinen, die auf bestimmte Bereiche (etwa Fussball, oder wissenschaftliche Disziplinen) eingeschränkt sind, und das spezielle Wissen über die Domänen ausnützen können. In diesem Seminar soll untersucht werden, wie man das strukturierte Vokabular einer Domäne heranziehen kann, um
a) einen möglichst exhaustiven Index der Domäne zu erstellen, d.h. möglichst alle
für die Domäne relevanten Seiten im Web zu finden,
b) möglichst präzise Analyse der indexierten Seiten durchzuführen, und
c) möglichst gute Interpretationen der Anfragen zu gewährleisten.
Wir werden eine sehr performante kommerzielle Suchmaschine verwenden, um Suchmaschinen für mehrere Domänen zu erstellen, d.h. jeder Teilnehmer sollte für einen konkreten Bereich eine Suchmaschine betreuen. Im Vordergrund sollen Techniken des vertikalen Crawlens, des Indexierens auf der Basis von vorgegebenen Vokabularien und der intelligenten Queryanalyse stehen.
Alle Teilnehmer werden individuell von Dozenten am CIS betreut, d.h. die Suchmaschine in Zusammenarbeit mit dem Dozenten aufbauen.
Ein Outline des Kurses findet man unter
www.cis.uni-muenchen.de/people/vs.html
Teilnahmebedingungen
Anmeldung beim Dozenten während der Semesterferien
Scheinkriterien
Aktive Mitarbeit, Referat und Hausarbeit
F. Guenthner
Hauptseminar
Zeit und Raum: Mi. 10 -12 , Raum 1.13
Inhalt und Ziel der Veranstaltung
Dieses Seminar setzt die Veranstaltung zum gleichen Thema im SS 2003 fort. Nach einer Zusammenfassung der wichtigsten Arbeiten zu Lokalen Grammatiken, die im letzten Semester behandelt wurden, sollen im wesentliche die Dissertationen von Sebastien Paumier und Mathieu Constant besprochen werden. Zusätzlich sollen die sich in Arbeit befindenden Lokalen Grammatiken für Menschenbezeichner, Organisationen, temporalen und lokativen Phrasen evaluiert bzw. erweitert werden.
Literatur
Teilnahmebedingungen
Anmeldung während der Semesterferien beim Dozenten
Scheinkriterien
Aktive Teilnahme, Referat und Hausarbeit
Hauptseminar (Organisation, Themen, Terminplan)
Zeit und Raum: Do. 14-16, Raum 1.39
Inhalt und Ziel der Veranstaltung
In diesem Seminar soll eine Grammatik für ein Fragment des Deutschen ausgearbeitet werden. Dabei soll u.a. besprochen werden:
Die Seminarteilnehmer sollen Grammatikregeln in Prolog formulieren und mit Hilfe eines vorgegebenen Parsers testen. Das Sprachfragment soll Aussagen im Aktiv und Passiv in verschiedenen Tempusformen umfassen, Verben mit Nominal- Präpositional- und Satzkomplementen, sowie Adverbial- und Relativsätze. Näheres wird im Seminar besprochen.
Literatur
Voraussetzungen
Proseminare Syntax und Einführung in das Symbolische Programmieren. Es wird dringend empfohlen, auch die Vorlesung ,,Parsing'' zu besuchen.
Scheinkriterien
Seminarvortrag und Implementierung
Hauptseminar
Zeit und Raum: Di. 12-14, Raum 0.33
Inhalt und Ziel der Veranstaltung
Die Konvertierung von Papierdokumenten in ein textuelles elektronisches Format ist ein zentraler Schritt bei der Archivierung von Dokumenten in Firmen, Organisationen und im Verlagswesen. Trotz der hohen Leistungsfähigkeit kommerzieller OCR-Systeme ist die verbleibende Fehlerrate bei fehlerkritischen Anwendungen aber oft inakzeptabel. Das Hauptseminar beginnt mit einer Einführung in die optische Charakter-Erkennung (OCR). Hauptgegenstand sind dann Verfahren zur Nachkorrektur von OCR-Ergebnissen. Der Schwerpunkt liegt auf lexikonbasierten Verfahren.
Literatur
Downloads
Korrekturressourcen (JAVA) (PERL)
Anmeldung
bis Mitte September bei Prof. Schulz per E-Mail.
Voraussetzungen
abgeschlossenes Grundstudium
Scheinkriterien
Referat und Hausarbeit
Oberseminar
Zeit und Raum: Do. 12-13, Raum B110
Inhalt und Ziel der Veranstaltung
Es werden aktuelle Themen und Arbeiten aus der CL besprochen.
Teilnahmebedingungen
persönliche Einladung
Oberseminar
Zeit und Raum: Di. 16-18, Raum 0.11
Inhalt und Ziel der Veranstaltung
Es werden aktuelle Themen und Arbeiten aus der CL besprochen.
Teilnahmebedingungen
persönliche Einladung
Oberseminar
Zeit und Raum: Mo. 10.00 s.t. - 11.30, Raum XY
Inhalt und Ziel der Veranstaltung
Erläuterungen am Institut für Informatik unter
http://www.pms.informatik.uni-muenchen.de/lehre/oberseminar/
Teilnahmebedingungen
persönliche Einladung
Übung
Zeit und Raum: Fr. 12-13, Raum 1.14
Inhalt und Ziel der Veranstaltung
Ziel der Übung ist es, die Grundfertigkeiten eines (Computerlinguistik-) Studiums zu vermitteln. Neben allgemeinen Hinweisen zum Studium werden folgende Fragen behandelt:
HINWEIS: Studenten, die bisher noch nicht an dieser Übung teilgenommen haben, wird dies dringend nahegelegt.
Voraussetzungen
keine
Scheinkriterien
Regelmäßige Teilnahme
Übung
Zeit und Raum: Fr. 13-14, Raum 1.14
Inhalt und Ziel der Veranstaltung
Die Übung bietet eine Einführung in das am CIS und auch sonst an den Universitäten vornehmlich eingesetzte Betriebssystem Unix bzw. Linux. Themen werden sein:
HINWEIS: Studienanfängern wird die Teilnahme an dieser Übung dringend nahegelegt. Hier werden die Grundlagen im Umgang mit dem Rechner vermittelt, dem wichtigsten Arbeitsgerät der Computerlinguisten.
Voraussetzungen
keine
Kolloquium
Zeit und Raum: Fr.10.00 - 12.00, Raum 0.05
Inhalt und Ziel der Veranstaltung
Das Kolloquium findet jeweils nach Ankündigung statt. Hier berichten Mitarbeiter und Gäste des Instituts über ihre laufenden Arbeiten.
Teilnahmebedingungen
Die Teilnahme am Kolloquium steht jedem offen.
Kolloquium
Zeit und Raum: Fr.8.00 - 10.00, Raum Theresienstr. E27
Inhalt und Ziel der Veranstaltung
Kolloquium des Graduiertenkollegs ,,Logik in der Informatik''. Die Kollegiaten und Gäste halten Vorträge. Siehe Ankündigungen.
Zeit und Raum: unregelmäßig mittwochs, zumeist in Raum E06, Schellingstr. 3
Inhalt und Ziel der Veranstaltung
Gäste des Instituts für Deutsche Philologie halten Vorträge zu sprachwissenschaftlichen Themen.
Arbeitsgemeinschaft
Zeit und Raum: Di. 18-20, Raum 1.13
Inhalt und Ziel der Veranstaltung
In dieser Veranstaltung werden wir neue Teilprojekte, die das bestehende CISLEX-System erweitern sollen, besprechen. Nach einer Bestandsaufnahme der aktuellen CISLEX-Datenbank werden neue Komponenten wie Kompositalexika, Multiwortlexeme, prädikative Nomen, Verbesserung des semantischen Kategoriensystems, Junktorenlexikon, usw. behandelt.
Teilnahmebedingungen
Anmeldung beim Dozenten während der Semesterferien ist erforderlich