CIS
Centrum für Informations- und Sprachverarbeitung
Ludwig-Maximilians-Universität München

Kommentiertes Vorlesungsverzeichnis
Wintersemester 2002/2003

Allgemeines

Das Centrum für Informations- und Sprachverarbeitung (CIS) befindet sich im Gebäudekomplex der Institute am Englischen Garten, Flügel B, 1. Stock. Adresse: Oettingenstr. 67, 80538 München. Tel: (089)2180-9721; FAX: (089) 2180-9701 Das Sekretariat ist für Studenten vormittags von 10-12 geöffnet.

Veranstaltungsbeginn und Räume

Die Veranstaltungen beginnen in aller Regel in der ersten Semesterwoche. Abweichungen davon werden rechtzeitig ausgehängt. Falls nicht anders angegeben finden die Veranstaltungen im Gebäude an der Oettingenstraße statt.

Vorlesungsverzeichnis im WWW

Das kommentierte Vorlesungsverzeichnis kann auch unter folgender Adresse im WWW eingesehen werden: http://www.cis.uni-muenchen.de/kurse

Nachbardisziplinen

Hingewiesen wird auch auf die Veranstaltungen des Instituts für Informatik , des Instituts für Philosophie, Logik und Wissenschaftstheorie (Ludwigstr.31), des Instituts für Phonetik und Sprachliche Kommunikation (Schellingstr.3) und schließlich auf die Veranstaltungen zur theoretischen Linguistik des Instituts für Deutsche Philologie (Schellingstr.3).

Hinweis

Ab dem Wintersemester 2002/2003 findet erstmalig die Übung ,,Technik des wissenschaftlichen Arbeitens'' statt. Für Hauptfachstudenten, die ihr Studium im Winter 2002 aufnehmen, ist die Teilnahme verbindlich. Allen übrigen Studenten wird die Teilnahme dringend empfohlen.

Fachschaft

Die Fachschaft Computerlinguistik, die selbstverwaltete Interessenvertretung der Studenten am Institut, ist unter http://www.cis.uni-muenchen.de/studenten/fachschaft zu erreichen. Kommilitonen, die sich für die Belange der Computerlinguistikstudenten engagieren wollen, sind herzlich willkommen.

Studienberatung

Die Studienberatung findet (nach Voranmeldung) in den Sprechstunden von Prof.Dr.Guenthner und Prof.Dr.Schulz statt. Ferner stehen alle Dozenten gerne zur Beratung zur Verfügung:

Stand: Jul 23, 2002





Logik und Automaten

H. Leiß


Vorlesung mit Übung

Zeit und Raum: Do. 14-17, Raum 1.43

Inhalt und Ziel der Veranstaltung

Üblicherweise wird eine (formale) Sprache durch eine Grammatik angegeben, die den Aufbau der sprachlichen Ausdrücke festlegt, oder durch einen Automaten, der die Zugehörigkeit eines Ausdrucks zur Sprache feststellt. Man kann eine formale Sprache aber auch durch eine logische Formel angeben, die eine charakterisierende Eigenschaft ihrer Elemente ausdrückt; damit ist man vom speziellen Format z.B. der kontextfreien oder der HPS-Grammatiken unabhängig.

Die Vorlesung behandelt einerseits Zusammenhänge zwischen diesen beiden Arten der Sprachdefinition und andererseits die zugehörigen Automaten, mit denen man Eigenschaften von Ausdrücken überprüfen kann.

Der Hauptzusammenhang besteht darin, daß die regulären Sprachen genau die sind, die man durch eine logische Formel mit Quantoren über Mengen von Positionen in den Zeichenreihen definieren kann. Ein solcher Zusammenhang gilt auch für den Fall der Baumsprachen, wo die Ausdrücke markierte Bäume sind (d.h. Terme statt Zeichenreihen). Hier ist von besonderem Interesse, herauszufinden, welche Eigenschaften von Bäumen, z.B. Syntaxbäumen oder XML-Dokumenten, eine effiziente Überprüfung durch Baumautomaten erlauben.

Die Vorlesung soll hervorheben, inwiefern die Automatentheorie ein Teil der Logik zweiter Stufe über endlichen Strukturen ist. In der Übung soll auf MONA, ein Werkzeug zur Übersetzung zweitstufiger Formeln in Automaten, und auf XML-Anfragesprachen eingegangen werden.

Literatur

Howard Straubing: Finite Automata, Formal Logic, and Circuit Complexity. Birkhauser, 1994

Voraussetzungen

Mathematische Grundlagen (Prädikatenlogik); Automaten und formale Sprachen

Scheinkriterien

Nach Rücksprache





Einführung in die Programmierung

M. Hadersbeck


Proseminarvorlesung

Zeit und Raum: Mo. 10-12, Raum 1.05 und Mi. 16-18, Raum 1.14;

Inhalt und Ziel der Veranstaltung

In dieser Veranstaltung werden Sie einen Überblick über die Arbeitsweise von Computern bekommen. Außerdem lernen wir Strategien und Vorgehensweisen zur Entwicklung von Computerprogrammen. Die Vorlesung gibt auch einen Überblick über verschiedene Programmiersprachen wie, C, JAVA, C++, Perl und Prolog. In der Übung werden kleine Programme selbst geschrieben.

Voraussetzungen

keine

Teilnahmebedingungen

Aktive Mitarbeit

Scheinkriterien

Aktive Teilnahme, Bearbeitung von Übungsaufgaben, Klausur





Algorithmen in C++

M. Hadersbeck


Proseminarvorlesung

Zeit und Raum: Mo. 16-18, Raum 0.37 und Mi. 12-14, Raum 1.27

Inhalt und Ziel der Veranstaltung

Im ersten Teil der Veranstaltung werden fortgeschrittene Konzepte von C++ gelehrt und im zweiten Teil werden in Arbeitsgruppen ausgewählte Aufgaben der Computerlinguistik programmiert und in der Vorlesung vorgestellt.

Die zu programmierenden Algorithmen werden am Anfang des Semesters vorgestellt.

Voraussetzungen

Die Veranstaltung baut auf die Veranstaltung ,,Objektorientiertes Programmieren mit C++ für Computerlinguisten'' im Sommersemster auf.

Scheinkriterien

Für die erfolgreiche Programmierung der Aufgabe in einer Arbeitsgruppe gibt es einen Proseminarschein.





Computerlinguistik II

S. Langer


Proseminarvorlesung

Zeit und Raum: Mo. 8-10, Raum 1.05 und Do. 16-18, Raum 1.05

Inhalt und Ziel der Veranstaltung

Die Veranstaltung behandelt die grundlegenden Aufgaben der Computerlinguistik anhand einer exemplarischen Implementierung der linguistischen Basismodule:

Am Ende des Semesters werden wir ein natürlichsprachliches Generierungs- und Analyse-System für einen kleinen Sprachausschnitt in Prolog implementiert haben. Der Praxisbezug erfordert mindestens Grundkenntnisse in Prolog und die Bereitschaft an den Übungen aktiv teilzunehmen.

Literatur

  1. F.C.N.Pereira, S.M.Shieber: Prolog and Natural Language Analysis, CSLI Lecture Notes Number 10, 1987, Stanford.
  2. Wenger, Karsten: Einführung in die Computerlinguistik. CIS-Bericht. (Skript zur Veranstaltung, beim Dozenten)

Voraussetzungen

Kenntnisse in Prolog. Teilnehmer ohne Grundkenntnisse in Prolog bitte rechtzeitig beim Dozenten melden.

Scheinkriterien

Übungen





Mathematik I

H. Leiß


Proseminarvorlesung

Zeit und Raum: Mi. 8 -10 , Raum 0.05 und Fr. 8-10, Raum 0.05

Inhalt und Ziel der Veranstaltung

Es wird eine Einführung in Teilgebiete der diskreten Mathematik gegeben, die es erleichtert, die formalen Grundlagen anderer Veranstaltungen im Studiengang Computerlinguistik zu verstehen. Behandelt werden

  1. Mathematische Grundbegriffe wie Mengen, Relationen, Funktionen
  2. Relationalstrukturen und Algebren
  3. Syntax und Semantik der Aussagen- und Prädikatenlogik
  4. Typen und Lambda-Terme.

Literatur

  1. Mathmatische Grundlagen I. Vorlesungsskriptum von Prof.K.Schulz.
  2. B.H.Partee, A.Ter Meulen, R.E.Wall: Mathematical Methods in Linguistics

Voraussetzungen

Keine

Scheinkriterien

Proseminarschein bei erfolgreicher Bearbeitung von Übungsaufgaben und Klausur.

Skriptum und Übungsaufgaben





Einführung in formale Methoden und Arbeitsweisen der Computerlinguistik

P. Maier-Meyer


Proseminar

Zeit und Raum: Mi. 16-18, Rechnerraum, Do. 14-16, Raum 0.43

Inhalt und Ziel der Veranstaltung

Dieser Kurs richtet sich speziell an Studenten des Aufbaustudiengangs ,,Computerlinguistik''. Im Rahmen dieser Einführung werden die formalen Grundlagen und elementaren Arbeitstechniken er Computerlinguistik in Theorie und Praxis vermittelt. Im Theorieteil geht es vor allem um die mathematischen Grundlagen:

Im Praxisteil lernen die Teilnehmer die Anwendung von verschiedenen Unix-Tools und der Skriptsprache Perl zur Lösung elementarer Aufgaben in der Computerlinguistik.

Literatur

  1. Barbara H. Partee, Alice ter Meulen & Robert Wall: Mathematical Methods in Linguistics, Kluwer Academic Publishers, 1990.
  2. Randal L. Schwartz, Tom Phoenix: Learning Perl, 3rd Edition Making Easy Things Easy and Hard Things Possible; 3rd Edition O'Reilly July 2001 0-596-00132-0.

Voraussetzungen

keine

Scheinkriterien

Übungsaufgaben und Klausur





Morphologie & Computerlexikographie

D. Schnorbusch


Proseminarvorlesung

Zeit und Raum: Di. 14-16, Raum 0.05 und Do. 12-14, Raum 0.05

Inhalt und Ziel der Veranstaltung

In diesem Seminar geht es zunächst um die Vermittlung vertiefter Kenntnisse der Flexions- und Wortbildungsmorphologie. Nach einem knappen Überblick über die verschiedenen Wortbildungsverfahren im Deutschen und anderer Sprachen werden wir uns mit den Problemen einer theoretisch angemessenen Erfassung der Daten befassen. Neben den klassischen Konzeptionen (I&A, I&P, W&P) werden dabei vor allem Modelle, die in der CL relevant sind (Finite-State-Morphology, Two-Level-Morphology) behandelt. Der zweite Schwerpunkt des Seminars ist die maschinelle Lexikographie, wobei es ein zentrales Thema sein wird, wie morphologische, syntaktische und semantische Eigenschaften von Wörtern in einem elektronischen Lexikon repräsentiert werden können. Themen werden hier unter anderem sein:

Teilnahmebedingungen

Aktive Mitarbeit, Übungen und Referat

Scheinkriterien

Aktive Mitarbeit, Übungen, Referat und Klausur





Formale Sprachen und Automaten

K.U. Schulz


Proseminarvorlesung

Zeit und Raum: Mo. 12-14, Raum 1.39, Do. 14-16, Raum 23

Inhalt und Ziel der Veranstaltung

Die Vorlesung gibt eine Einführung in die Theorie der formalen Sprachen und der zu ihrer Erkennung nötigen Automatenmodelle. Der Zusammenhang zur Semantik von sequentiellen Programmiersprachen wird erläutert. Damit werden die Grundlagen für eine Beschäftigung mit maschineller Analyse natürlicher Sprachen gelegt. Behandelt werden:

Literatur

  1. Hopcroft / Ullman: Introduction to Automata Theory, Languages and Computation. Addison Wesley 1979.
  2. N.Moll / M.Arbib / A.J.Kfoury: An Introduction to Formal Language Theory. Springer-Verlag, 1988.
  3. H.Leiß: Formale Sprachen und Automaten. Vorlesungsskript. München 1997.

Voraussetzungen

Mathematischer Grundkurs oder entsprechende Kenntnisse

Scheinkriterien

Schein bei aktiver Teilnahme und Lösung von Übungsaufgaben.





Computerlinguistik I

J. Schuster


Proseminarvorlesung

Zeit und Raum: Di. 8 - 10 , Raum 0.05 und Do. 8-11, Raum 1.05

Inhalt und Ziel der Veranstaltung

Ziel dieser Veranstaltung ist es, eine Einführung in die theoretische Linguistik sowie einen Überblick über die wichtigsten Gebiete der Computerlinguistik zu geben. Im Bereich der theoretischen Linguistik werden deren Hauptgebiete und deren Arbeitstechniken anhand folgender Themenkreise besprochen: Morphologie und Lexikon: welche Regularitäten sind bei der Formenbildung zu beobachten und wie werden die sprachlichen Elemente im Lexikon verzeichnet? Phonologie und Phonetik: wie können sprachliche Laute beschrieben werden und welchen Regularitäten unterliegen sie, wie ist das Verhältnis zwischen Lauten und Bedeutung? Syntax: nach welchen Gesetzmäßigkeiten können Wörter zu größeren Einheiten bis hin zu Sätzen kombiniert werden? Semantik: was ist die Bedeutung sprachlicher Einheiten und wie setzt sich die Bedeutung komplexer Einheiten aus der Bedeutung der Bestandteile zusammen? Pragmatik: was spielt außerdem bei der Interpretation von Äußerungen eine Rolle? Im Bereich der Computerlinguistik wird anhand einiger typischer Anwendungsprogramme auf die speziellen Anforderungen in diesem Fach eingegangen.

Literatur

Grewendorf, G., F. Hamm & W. Sternefeld (1987): Sprachliches Wissen. Eine Einführung in moderne Theorien der grammatischen Beschreibung.

Voraussetzungen

Keine

Scheinkriterien

Referat, Übungsaufgaben und Klausur

Aktuelle Hinweise





Perl für Fortgeschrittene

H. Bosk


Proseminarvorlesung

Zeit und Raum: Fr. 14-16, Rechnerraum

Inhalt und Ziel der Veranstaltung

Es sollen vorhandene Kenntnisse vertieft und Themen der fortgeschrittenen Perl-Programmierung vermittelt werden, insbesondere die Nutzung vorhandener Perl-Module. Für die Programmierhausaufgaben sind mehrere Stunden pro Woche einzuplanen. Einige der geplanten Themen (noch nicht verbindlich):

Literatur

  1. Wall, Christiansen, Orwant: ,,Programming Perl''
  2. Christiansen, Torkington: ,,Perl Cookbook''

Voraussetzungen

Schein in 'Korpus- und Unix-Tools' oder vergleichbare Kenntnisse

Scheinkriterien

Der Erwerb eines Proseminarscheins setzt die regelmäßige Anfertigung der Programmieraufgaben voraus.





Datenbanken

Chr. Draxler


Proseminar

Zeit und Raum: Mo. 8-10, Raum 15

Inhalt und Ziel der Veranstaltung

Datenbanken erlauben eine anwendungsunabhängige Speicherung von und einen kontrollierten Zugriff auf sehr große Datenmengen - z.B. Sprachsignale, Transkriptionen, Lexika. Dieses Seminar führt anhand praktischer Beispiele aus der Phonetik und Computerlinguistik in das Gebiet ein:

Literatur

Zum Seminar erscheint ein Skript im WWW. Literatur wird im Seminar bekanntgegeben.

Voraussetzungen

Bereitschaft zur Arbeit am Computer

Scheinkriterien

Vortrag und Hausarbeit





Einführung in Java

Chr. Draxler


Proseminar

Zeit und Raum: Mo. 10-12, Rechnerraum

Inhalt und Ziel der Veranstaltung

Java ist eine moderne objektorientierte und plattformunabhängige Programmiersprache, die sowohl zur Programmierung von eigenständigen Applikationen als auch von Applets, das sind Programme, die innerhalb eines WWW-Browsers laufen, verwendet wird.

Der Javakurs besteht aus zwei Teilen: eine Einführung ins Programmieren in Java im Wintersemester, und fortgeschrittenes Programmieren in Java im Sommersemester.

Themen im Wintersemester sind: objektorientiertes Programmieren, elementare Programmierkonstrukte wie Schleifen, Fallunterscheidungen und Rekursion sowie der Aufbau eigener Datenstrukturen und elementare Ein- und Ausgabe. Themen des Sommersemesters sind grafische Oberflächen, Multimedia, das WWW sowie Datenbankzugriffe von Java aus.

Die Programmierbeispiele stammen größtenteils aus dem Bereich der Phonetik bzw. Linguistik. Im Kurs stelle ich Programmfragmente vor, die in eigener Arbeit dann vervollständigt werden müssen.

Literatur

  1. Java Tutorial, http://java.sun.com/docs/books/tutorial/,
  2. http://fishmac.phonetic.uni-muenchen.de/JavaKurs/,
  3. David Flanagan: Java in a Nutshell, O'Reilly Press, Sebastopol, 1997

Voraussetzungen

Programmiererfahrung in einer anderen Programmiersprache wünschenswert, selbstständiges Arbeiten während der Woche.

Scheinkriterien

auf Wunsch stelle ich einen Teilnahmeschein aus. Einen Schein mit Leistungsnachweis gibt es für ein selbstständig ausprogrammiertes Anwendungsprogramm.





Signalverarbeitung

T. Horn


Proseminarvorlesung

Zeit und Raum: Do. 16-18, Raum 0.15

Inhalt und Ziel der Veranstaltung

Die Informationsverarbeitung teilt sich in Signal- und Symbolverarbeitung, die Sprachverarbeitung entsprechend in speech und language processing.
Ein Signal ist hier der zeitliche Verlauf einer physikalischen Größe, ein speech signal z.B. der per Mikrofon erfaßte Schalldruck vor dem Mund eines Sprechers.
Als Samples, d.h. in diskreter Repräsentation durch Zahlenfolgen, lassen sich Signale digital weiterverarbeiten.
Aktuell verbreitete Anwendungen digitaler Signalverarbeitung sind z.B. Mobiltelefon und MP3-Player.
Das Seminar ist wie folgt gekennzeichnet:

Teilnahmebedingungen

keine

Scheinkriterien

kurze mündliche Prüfung





Mel'cuk und Mercury: Berechnung von Paraphrasen und Extraktion von Propositionen

H. Leiß & J. Schuster


Proseminarvorlesung

Zeit und Raum: Fr. 12 -14 , Raum 0.15

Inhalt und Ziel der Veranstaltung

Das Seminar hat einen linguistischen und einen programmiertechnischen Teil. Im linguistischen Teil geht es darum, Techniken zur Normalisierung von Ausdrücken zu entwickeln, d.h. (weitgehend) synonyme Ausdrücke auf dieselben prädikativen Strukturen abzubilden. Im programmiertechnischen Teil geht es darum, Programme zum Matchen dieser Strukturen zu schreiben. Genauer gesagt werden wir Igor Mel'cuks lexikalische Funktionen kritisch betrachten und eine modifizierte Version davon für die Kodierung von englischen Stützverb- und anderen Konstruktionen verwenden. Dann werden wir die kodierten Daten in der prologähnlichen Programmiersprache Mercury implementieren, um Propositionen aus Texten zu extrahieren. Ein Beispiel: Dass Deutschland Brasilien heftigen Widerstand geleistet hat, kann man unter anderem durch folgende Sätze ausdrücken:

  1. Germany fiercely resisted Brazil.
  2. Germany offered fierce resistance to Brazil.
  3. Brazil encountered fierce German resistance.
  4. Brazil encountered fierce resistance from Germany.

Anhand von auf Mel'cukschen Ideen beruhenden Patterns, die dem prädikativen Nomen resistance zugeordnet werden sollen, wird es möglich sein, alle diese Sätze auf dieselbe Proposition, nämlich MAGN(RESIST(Germany, Brazil)) abzubilden. Mit einem im Seminar zu schreibenden Programm kann dann so eine Proposition auf einem bereits getaggten Text gematcht werden. Dabei soll die Proposition auch Leerstellen aufweisen dürfen. Es sollen also Fragen möglich sein wie MAGN(RESIST(Germany, X)) , wo die Antwort X = Brazil lautet, falls irgendein Satz aus 1) bis 4) im Korpus ist. Ziel des Seminars ist also, für ein Fragment des Englischen Paraphrasierroutinen und Programme für semantisches (im Gegensatz zu String-)Matching zu entwickeln.

Literatur

  1. Igor A. Mel'cuk. Vers une linguistique Sens-Texte. Leçon inaugurale (faite le Vendredi 10 janvier 1997), Collège de France, Chaire internationale, 1997
    http://www.fas.umontreal.ca/LING/olst/
  2. Igor A. Mel'cuk and others. Introduction à la lexicologie explicative et combinatoire. Louvain-la-Neuve/Belgium, Editions Duculot, 1995.
  3. Alain Polguère.La théorie Sens-Texte Dialangue, 8-9, Université du Québec à Chicoutimi, 9-30, 1998.
    http://www.fas.umontreal.ca/LING/olst/

    http://www.cs.mu.oz.au/research/mercury/

    http://www.cs.mu.oz.au/research/mercury/information/doc-release/reference_manual_toc.html

Voraussetzungen

Linguistische Grundkenntnisse und/oder Grundkenntnisse in Prolog.

Scheinkriterien

Um einen Schein zu erwerben, muss man entweder eine linguistische oder eine Programmieraufgabe übernehmen. Man kann - je nach Schwierigkeit und Umfang der übernommenen Aufgabe - einen Pro- oder einen Hauptseminarschein erwerben.





Grammatiktheorien im Vergleich

L. Behrens


Hauptseminar

Zeit und Raum: monatlich Mi. 16 -20 , Raum 1.15, Do. 16-20, Raum 1.31

Inhalt und Ziel der Veranstaltung

Verglichen mit den 70er Jahren ist die Anzahl der Grammatiktheorien enorm angestiegen. Parallel zur dieser Aufsplitterung lässt sich aber auch eine gewisse Annäherung zwischen verschiedenen Schulen und Ansätzen beobachten. Trotzdem gilt der Slogan der Postmoderne ,,Anything goes'' für die Linguistik nicht. Dieses Seminar sollte Studierenden die Möglichkeit geben, die wichtigsten ? generativen und nichtgenerativen - Theorien in der Linguistik miteinander zu vergleichen, nämlich :

Wir werden die genannten Theorien einzeln vornehmen und uns mit ihren Grundannahmen, Zielen, Methoden, Argumenten und Notationen befassen. Dabei sollen im Hauptseminar die wichtigsten Unterschiede und Gemeinsamkeiten zwischen ihnen herausgearbeitet werden. Zu diesem Zweck werden wir auch versuchen, die jeweils typischen Analysemethoden und Argumentationen an ausgewählten Phänomenen (z.B. Passiv oder Kongruenz) durchzuspielen.

Literatur

  1. Brown, Keith / Miller, Jim (1997), Concise Encyclopedia of Syntactic Theories. Elsevier (Pergamon).
  2. Droste, Flip G. / Joseph, John E. (ed.) (1991), Linguistic Theory and Grammatical Description. (Current Issues in Linguistic Theory 75) Amsterdam: John Benjamins.
  3. Edmondson, Jerold A. / Burquest, Donald A. (1992/1998), A Survey of Linguistic Theories. Dallas, Texas: The Summer Institute of Linguistics.
  4. Jacobs, Joachim / von Stechow / Sternefeld, Wolfgang / Vennemann, Theo (1993), Syntax. Ein internationales Handbuch zeitgenössischer Forschung. 1. Halbband. Berlin: de Gruyter.

Termine

Das Hauptseminar findet als Blockveranstaltung statt, monatlich, jeweils an zwei aufeinanderfolgenden Tagen in der Woche.

Scheinkriterien

Referat und Hausarbeit

Anmeldung

Anmeldung und weitere Info per e-mail (Leila.Behrens@uni-koeln.de)





Syntaktisches und Semantisches Tagging

F. Guenthner & H. Bosk


Hauptseminar

Zeit und Raum: Mo. 12 -15 , Raum 1.13, Mi. 10-13, Raum 1.13

Inhalt und Ziel der Veranstaltung

Tagging ist ein Verfahren, unter dem man die Zuordnung von linguistischen Informationen (morphologischer, syntaktischer und semantischer Art) an lexikalischen Einheiten versteht. Diese Veranstaltung besteht aus einem theoretischen und einem praktischen Teil. Zum einen sollen die Grundprobleme von Taggingmethoden (z.B. was sind lexikalische Einheiten, was versteht man unter ,,ambigen Einheiten'', was ist ein morphologisches Lexikon, welche syntaktischen und semantischen Kategorien gibt es, usw.) behandelt werden. Im Anschluss daran behandeln wir dann Fragen wie: welche Verfahren zur Disambiguierung gibt es und wie interagiert das Tagging mit anderen Verfahren (z.b. dem Parsen).

Im praktischen Teil wollen wir vorhandene, grosse, (partiell) getaggte, (englische, deutsche, französische und spanische) Korpora hinsichtlich Fehlertypen analysieren und Vorschläge zur automatischen Korrektur ausarbeiten.

Voraussetzungen

Zwischenprüfung

Anmeldung

Die Anmeldung vor Semesterbeginn ist zwecks Vorbereitungsarbeiten erforderlich.





Probleme der maschinellen Übersetzung

F. Guenthner & J. Goller


Hauptseminar

Zeit und Raum: Mi. 14 -16 , Raum 1.15, Do. 10-12, Raum 1.05

Inhalt und Ziel der Veranstaltung

Die maschinelle Übersetzung ist nicht nur das älteste Anwendungsgebiet der Computerlinguistik, sie zeigt auch am deutlichsten, wie weit entfernt man noch von adäquaten Beschreibungen einzelner Sprachen ist. In diesem Seminar wird zunächst das Ziel der automatischen Übersetzung (auch anhand exitieriender Systeme) beschrieben und anschliessend der Begriff einer ,,kontrastiven Grammatik'' als Grundlage für empirisch interessante Übersetzungssysteme behandelt.

Weitere Informationen zum Seminar auf der Hompage des MÜ-Seminars

Voraussetzungen

Dieses Seminar kann als Pro- oder Hauptseminar belegt werden

Anmeldung

Die Anmeldung vor Semesterbeginn ist zwecks Vorbereitungsarbeiten erforderlich.





Effiziente Stringalgorithmen

K.U. Schulz


Hauptseminar

Zeit und Raum: Di. 10-13, Raum 1.35

Inhalt und Ziel der Veranstaltung

Gegenstand der Vorlesung/des Seminars sind effiziente Algorithmen und Datenstrukturen zur Stringverarbeitung. Behandelt werden insbesondere Verfahren zur exakten und zur approximativen Stringsuche in Texten, Ähnlichkeitssuche in Wörterbüchern und Verallgemeinerungen, Berechnung von Suffixbäumen.

Literatur

  1. G.A. Stephen: ,,String Searching Algorithms'', World Scientific 1994.
  2. Dan Gusfield: ,,Algorithms on Strings, Trees, and Sequences'', Cambridge University Press, 1997.
  3. G. Navarro and M. Raffinot: ,,Flexible Pattern Matching in Strings'', Cambridge University Press, 2002.

Voraussetzungen

Grundkenntnisse in formalen Sprachen. Voraussetzung zum Erwerb eines Seminarscheins sind weiter Programmierkenntnisse in C oder C++.

Anmeldung

Anmeldung nur erforderlich bei Wunsch nach Erwerb eines Seminarscheins. Diesbezügliche Anmeldungen (auch per E-Mail) werden nur bis 20.9.2002 berücksichtigt!

Scheinkriterien

Referat und Hausarbeit





XML-Anfragesprachen

K.U. Schulz & H. Meuss


Hauptseminar

Zeit und Raum: Di. 16-18, Raum 0.43

Inhalt und Ziel der Veranstaltung

XML ist eine weit verbreitete Dokument- und Datenrepräsentationssprache, die sowohl im als auch ausserhalb des Internets verwendet wird. Für die Verarbeitung von XML Dokumenten werden Anfragesprachen benutzt, mit denen man in den Dokumenten Elemente selektiert und gegebenenfalls neue Dokumente konstruiert. Diesen Anfragesprachen liegen meist Datenbank-Paradigmen zugrunde; es gibt aber auch vereinzelte Ansätze, die sich am Information Retrieval orientieren und z.B. ein Ranking der Antworten erlauben. In der Veranstaltung werden sowohl standardisierte XML Anfragesprachen (wie z.B. XQuery) als auch neue Forschungsansaetze vorgestellt.

Voraussetzungen

XML Kenntnisse





Zu neueren Arbeiten in der CL

F. Guenthner


Oberseminar

Zeit und Raum: Do. 12-13, Raum B110

Inhalt und Ziel der Veranstaltung

Es werden aktuelle Themen und Arbeiten aus der CL besprochen.

Teilnahmebedingungen

persönliche Einladung





Knowledge Representation and Markup Languages

Dozenten der Informatik & K. Schulz


Oberseminar

Zeit und Raum: Mo. 10.00 s.t. - 11.30, Raum Z 1.09

Inhalt und Ziel der Veranstaltung

Erläuterungen am Institut für Informatik unter

http://www.pms.informatik.uni-muenchen.de/lehre/oberseminar/

Teilnahmebedingungen

persönliche Einladung





Technik des wissenschaftlichen Arbeitens

C. Draxler, S. Langer , D. Schnorbusch & Co.


Übung

Zeit und Raum: Fr. 12-13, Raum 1.14

Inhalt und Ziel der Veranstaltung

Ziel der Übung ist es, die Grundfertigkeiten eines (Computerlinguistik-) Studiums zu vermitteln. Neben allgemeinen Hinweisen zum Studium werden folgende Fragen behandelt:



HINWEIS: Die Teilnahme an der Übung ist für alle Hauptfachstudenten, die ihr Studium im Wintersemester beginnen, verpflichtend und wird auch fortgeschrittenen Studenten dringend empfohlen.

Voraussetzungen

keine





UNIX-Grundlagen

W. Mederle & J. Stiehler


Übung

Zeit und Raum: Fr. 13-14, Raum 1.14

Inhalt und Ziel der Veranstaltung

Die Übung bietet eine Einführung in das am CIS und auch sonst an den Universitäten vornehmlich eingesetzte Betriebssystem Unix bzw. Linux. Themen werden sein:

HINWEIS: Studienanfängern wird die Teilnahme an dieser Übung dringend nahegelegt. Hier werden die Grundlagen im Umgang mit dem Rechner vermittelt, dem wichtigsten Arbeitsgerät der Computerlinguisten.

Voraussetzungen

keine





Kolloquium Computerlinguistik

F. Guenthner & K. Schulz


Kolloquium

Zeit und Raum: Fr.10.00 - 12.00, Raum 1.05

Inhalt und Ziel der Veranstaltung

Das Kolloquium findet jeweils nach Ankündigung statt. Hier berichten Mitarbeiter des Instituts und Gäste über ihre laufenden Arbeiten.

Teilnahmebedingungen

Die Teilnahme am Kolloquium steht jedem offen.



Logik in der Informatik

Dozenten der Informatik & K.Schulz


Kolloquium

Zeit und Raum: Fr.8.00 - 10.00, Raum Theresienstr. E27

Inhalt und Ziel der Veranstaltung

Kolloquium des Graduiertenkollegs ,,Logik in der Informatik''. Die Kollegiaten und Gäste halten Vorträge. Siehe Ankündigungen.



Linguistisches Kolloquium

Dozenten der Linguistik


Zeit und Raum: unregelmäßig mittwochs, zumeist in Raum E06, Schellingstr. 3 Inhalt und Ziel der Veranstaltung

Gäste des Instituts für Deutsche Philologie halten Vorträge zu sprachwissenschaftlichen Themen.





Arbeitsgemeinschaft CISLEX

F. Guenthner


Arbeitsgemeinschaft

Zeit und Raum: Di. 18-20, Raum 0.43

Inhalt und Ziel der Veranstaltung

In dieser Veranstaltung werden wir neue Teilprojekte, die das bestehende CISLEX-System erweitern sollen, besprechen. Nach einer Bestandsaufnahme der aktuellen CISLEX-Datenbank werden neue Komponenten wie Kompositalexika, Multiwortlexeme, prädikative Nomen, Verbesserung des semantischen Kategoriensystems, Junktorenlexikon, usw. behandelt.

Teilnahmebedingungen

Anmeldung beim Dozenten während der Semesterferien ist erforderlich




File translated from TEX by T T H, version 3.01.
On 23 Jul 2002, 17:05.