Seminar elektronische Lexikographie und Morphologie

Wintersemester 1998/99

Studiengang Computerlinguistik am CIS

Dozent: Stefan Langer


Zeit:Montag 9-11Mittwoch 9 -11
Raum:0.4111 (Kellergeschoss)

Erste Sitzung am 4. November


Inhalt und Ziel der Veranstaltung

Dieses Seminar umfasst die Lehrinhalte der bisherigen Seminare "elektronische Lexikographie" und "Morphologie". Es gibt eine detaillierte Einführung in die maschinelle Lexikographie. Die Erstellung, Wartung und Inhalte elektronischer Wörterbücher werden ebenso behandelt wie Anwendungen elektronischer Lexika, z.B für die Rechtschreibkorrektur, das Information Retrieval und die automatische Übersetzung.

Ein besonderer Schwerpunkt liegt auf der lexikographischen Behandlung der Morphologie des Deutschen. Einige Themenschwerpunkte neben der Morphologie werden sein:

Die Theorie wird ergänzt durch praktische Übungen  wie Verwendung von Unixbefehlen und Programmen zur Korpusverarbeitung; Speicherung und Verwaltung elektronischer Lexika; Implementierung von Lexikonabfragen.


Teilnahmevoraussetzungen

Das Seminar ist geeignet für Studentinnen und Studenten mit computerlinguistischen Grundkenntnissen. Dazu gehören:


Scheinvoraussetzungen

Referat mit Begleitpapier und Bearbeitung der Übungsaufgaben. Teilnehmer sollten sich möglichst früh mit dem Dozenten wegen Referatsvergabe in Verbindung setzen.


Referatsthemen


Anmeldung

Möglichst früh, direkt beim Dozenten, per Elektrobrief oder persönlich.


Wie erreicht man den Dozenten?

Offizielle Sprechstunde: Montag 11-12 (nach dem Seminar)
Ich bin aber jederzeit ansprechbar und zu finden im Zimmer 111, Oettingenstr.
Regelmäßig wird auch meine Elektropost gelesen: stef@cis.uni-muenchen.de




Literaturhinweise

(Mit *: Zur Lektüre für alle Teilnehmer empfohlen)


Elektronische Lexikographie allgemein

* OOI, Vincent B.Y. (1998): Computer Corpus Lexicography. (Edinburgh textbooks in empircal linguistics). Edinburgh University Press.


Elektronische Lexikographie für das Deutsche

HEß, Klaus, Jan BRUSTKERN, Winfried LENDERS (1983): Maschinenlesbare deutsche Wörterbücher. Dokumentation, Vergleich, Integration.
Die Anfänge der elektronischen Lexikographie für das Deutsche sind hier dokumentiert.

* GUENTHNER, Franz, Petra MAIER (1994): Das CISLEX-Wörterbuchsystem. München: Universität München. (= CIS Bericht 94-76).


Datenbeschaffung und statistische Korpusauswertung

BASILI, Roberto, Maria Teresa PAZIENZA, Paola VELARDI (1994): Lexicon Acquisition for Real Natural Language Processing Systems. Cambridge: Cambridge University Press.

CHURCH, Kenneth Ward, Patrick HANKS (1990): Word Association Norms, Mutual Infor-mation, and Lexicography. In: Computational Linguistics 16 (1), S. 22-29..

DAGAN, Ido, Fernando PEREIRA, Lillian LEE (1994): Similarity-Based Estimation of Word Cooccurence Probabilities. Elektronisches Archiv der ACL: Cmp-lg 9405001.

GALE, William A., Kenneth W. CHURCH, David YAROWSKY (1992): A Method for Disambiguating Word Senses in a Large Corpus. In: Computers and the Humanities 26/5-6, S. 415-439.

SMADJA, Frank (1993): Retrieving Collocations from Text: Xtract. In: Computational Lingui-stics 19/1, S. 143-177.

ZERNIK, Uri (Hrsg.) (1991): Lexical Acquisition. Using On-line Resources to Build a Lexicon. Hillsdale: Lawrence Erlbaum.


Lexikalische Semantik

*CRUSE, D. A. (1986): Lexical Semantics. Cambridge: Cambridge University Press.

KROVETZ, R. (1997): Homonymy and Polysemy in Information Retrieval. Tagungsband ACL/EACL 1997, 72-79.
Lexikalische Semantik und Information Retrieval

PUSTEJOVSKY, James (Hrsg.) (1993): Semantics and the Lexicon. Dordrecht u.a.: Kluwer. (= Studies in Linguistics and Philosphy 49).

TUTIN, Agnes (1996): The formalization of collocations for Natural Language Processing: the Syntagmatic Lexical Functions Model. Proceedings of COMPLEX 1996, 243-256.
Zu Mel'chuk


WordNet

BECKWITH, Richard, Christiane FELLBAUM, Derek GROSS, George MILLER (1991): WordNet: A lexical database organized on psycholinguistic principles. In: Uri Zernik: Lexical Acquisition. Hillsdale u.a.: Erlbaum, S. 211-232.
WordNet Veröffentlichungen auch unter: http://www.cogsci.princeton.edu/~wn/papers


Morphologie des Deutschen

FLEISCHER, Wolfgang/ BARZ, Irmhild (1992): Wortbildung der deutschen Gegenwartssprache. Tübingen, Niemeyer.
Standardwerk, beschreibungsorientiert, nur Derivationsmorphologie, eignet sich als Einführung in die Derivationsmorphologie in der Germanistischen Linguistik


Computermorphologie

*SPROAT, R. 1992. Morphology and Computation. Cambridge; Mass.: MIT Press.



(Elektronische) Lexikographie im Internetz

Die folgenden Resourcen und elektronischen Literaturhinweise sind nur eine kleine, individuelle Auswahl zur Anregung - sie müssen nicht obligatorisch von allen Kursteilnehmern erarbeitet werden. Ergänzungen erwünscht!


Übersichten


Abgeschlossene und laufende Lexikonprojekte - z.T. mit Lexika zum Herunterladen


Hypertextwörterbücher auf dem Internet


Elektronische Wörterbücher auf dem Netz (zum Herunterladen oder Anschauen)


Andere Wörterbücher auf dem Netz


Werkzeuge für die Lexikographin


Diverses


Morphologische Resourcen im Internet


Resourcelisten


Literatur zur Morphologie


Morphologieprogramme




CIS-Homepage