| Zeit: | Montag 9-11 | Mittwoch 9 -11 |
|---|---|---|
| Raum: | 0.41 | 11 (Kellergeschoss) |
Erste Sitzung am 4. November
Dieses Seminar umfasst die Lehrinhalte der bisherigen Seminare "elektronische Lexikographie" und "Morphologie". Es gibt eine detaillierte Einführung in die maschinelle Lexikographie. Die Erstellung, Wartung und Inhalte elektronischer Wörterbücher werden ebenso behandelt wie Anwendungen elektronischer Lexika, z.B für die Rechtschreibkorrektur, das Information Retrieval und die automatische Übersetzung.
Ein besonderer Schwerpunkt liegt auf der lexikographischen Behandlung der Morphologie des Deutschen. Einige Themenschwerpunkte neben der Morphologie werden sein:
Die Theorie wird ergänzt durch praktische Übungen wie Verwendung von Unixbefehlen und Programmen zur Korpusverarbeitung; Speicherung und Verwaltung elektronischer Lexika; Implementierung von Lexikonabfragen.
Das Seminar ist geeignet für Studentinnen und Studenten mit computerlinguistischen Grundkenntnissen. Dazu gehören:
Referat mit Begleitpapier und Bearbeitung der Übungsaufgaben. Teilnehmer sollten sich möglichst früh mit dem Dozenten wegen Referatsvergabe in Verbindung setzen.
Möglichst früh, direkt beim Dozenten, per Elektrobrief oder persönlich.
Offizielle Sprechstunde: Montag 11-12 (nach dem Seminar)
Ich bin aber jederzeit ansprechbar und zu finden im Zimmer 111, Oettingenstr.
Regelmäßig wird auch meine Elektropost gelesen: stef@cis.uni-muenchen.de
(Mit *: Zur Lektüre für alle Teilnehmer empfohlen)
* OOI, Vincent B.Y. (1998): Computer Corpus Lexicography. (Edinburgh textbooks in empircal linguistics). Edinburgh University Press.
HEß, Klaus, Jan BRUSTKERN, Winfried LENDERS (1983): Maschinenlesbare deutsche Wörterbücher. Dokumentation, Vergleich, Integration.
Die Anfänge der elektronischen Lexikographie für das Deutsche sind hier dokumentiert.
* GUENTHNER, Franz, Petra MAIER (1994): Das CISLEX-Wörterbuchsystem. München: Universität München. (= CIS Bericht 94-76).
BASILI, Roberto, Maria Teresa PAZIENZA, Paola VELARDI (1994): Lexicon Acquisition for Real Natural Language Processing Systems. Cambridge: Cambridge University Press.
CHURCH, Kenneth Ward, Patrick HANKS (1990): Word Association Norms, Mutual Infor-mation, and Lexicography. In: Computational Linguistics 16 (1), S. 22-29..
DAGAN, Ido, Fernando PEREIRA, Lillian LEE (1994): Similarity-Based Estimation of Word Cooccurence Probabilities. Elektronisches Archiv der ACL: Cmp-lg 9405001.
GALE, William A., Kenneth W. CHURCH, David YAROWSKY (1992): A Method for Disambiguating Word Senses in a Large Corpus. In: Computers and the Humanities 26/5-6, S. 415-439.
SMADJA, Frank (1993): Retrieving Collocations from Text: Xtract. In: Computational Lingui-stics 19/1, S. 143-177.
ZERNIK, Uri (Hrsg.) (1991): Lexical Acquisition. Using On-line Resources to Build a Lexicon. Hillsdale: Lawrence Erlbaum.
*CRUSE, D. A. (1986): Lexical Semantics. Cambridge: Cambridge University Press.
KROVETZ, R. (1997): Homonymy and Polysemy in Information Retrieval. Tagungsband ACL/EACL 1997, 72-79.
Lexikalische Semantik und Information Retrieval
PUSTEJOVSKY, James (Hrsg.) (1993): Semantics and the Lexicon. Dordrecht u.a.: Kluwer. (= Studies in Linguistics and Philosphy 49).
TUTIN, Agnes (1996): The formalization of collocations for Natural Language Processing: the Syntagmatic Lexical Functions Model. Proceedings of COMPLEX 1996, 243-256.
Zu Mel'chuk
BECKWITH, Richard, Christiane FELLBAUM, Derek GROSS, George MILLER (1991): WordNet: A lexical database organized on psycholinguistic principles. In: Uri Zernik: Lexical Acquisition. Hillsdale u.a.: Erlbaum, S. 211-232.
WordNet Veröffentlichungen auch unter: http://www.cogsci.princeton.edu/~wn/papers
FLEISCHER, Wolfgang/ BARZ, Irmhild (1992): Wortbildung der deutschen Gegenwartssprache. Tübingen, Niemeyer.
Standardwerk, beschreibungsorientiert, nur Derivationsmorphologie, eignet sich als Einführung in die Derivationsmorphologie in der Germanistischen Linguistik
*SPROAT, R. 1992. Morphology and Computation. Cambridge; Mass.: MIT Press.
Die folgenden Resourcen und elektronischen Literaturhinweise sind nur eine kleine, individuelle Auswahl zur Anregung - sie müssen nicht obligatorisch von allen Kursteilnehmern erarbeitet werden. Ergänzungen erwünscht!