Information Extraction - Seminar

Summary

Bei der Informationsextraktion (IE) geht es um die automatische Extraktion von Information aus Volltexten. Die Anwendungen erstrecken sich von der Unterstützung von Internet-Suchmaschinen bis hin zum automatischen Aufbau von Fachdatenbanken. Die Methoden reichen von der Analyse natürlicher Sprache über automatische Termerkennung bis zu automatischen Lernverfahren, wobei symbolische, statistische und hybride Methoden zum Einsatz kommen. Komplexe Informationsstrukturen können mit sogenannten Templates (Informationsmustern) repräsentiert werden. In der Veranstaltung werden verschiedene Anwendungen und Methoden für diverse Anwendungsdomänen betrachtet.

Inhalte:

Das Seminar behandelt Ansätze, Verfahren und Werkzeuge der Informationsextraktion und legt einen besonderen Fokus auf die Erkennung von Eigennamen und von domänen- bzw. fachspezifischer Information. Auch sollen Fragestellungen der Evaluation derartiger Verfahren diskutiert werden.

Lernziele:

Die Teilnehmer sollen lernen, wie sie Ressourcen für IE Systeme bewerten können. Außerdem sollen sie befähigt werden, dass sie bei der Entwicklung, beim Einsatz und bei der Bewertung von IE-Systemen mitwirken können.

Here is a link to the Lecture

Instructor

Alexander Fraser

Email Address: SubstituteMyLastName@cis.uni-muenchen.de

CIS, LMU Munich


Tutor: Fabian Dreer

Email Address: SubstituteFabiansLastName@cip.ifi.lmu.de


Schedule

There are *two separate seminars*. You EITHER go on Wednesdays, OR you go on Thursdays, NOT BOTH!

Wed: 12:00 c.t., Room L155

Thurs: 10:00 c.t., Room U127


IMPORTANT: Class is in *Gobi computer lab* on December 2nd and 3rd!

If this web page does not seem to be up to date, use the refresh button in your browser.
Date Topic Materials
October 15th and October 21st Information on Participants, Ungraded/Anonymous Quiz
October 22nd and October 28th Referatsthemen presentation, with registration for topics October 29th at 19:00 by email pptx pdf
October 29th and November 4th Practical Exercise (Manual Rules) *** in Gobi *** tar.gz (See included slides)
December 2nd and December 3rd Machine Learning Exercise *** in Gobi *** tar.gz (See included slides)
February 3rd and February 4th Machine Learning Exercise on Sequences *** in Kalahari (NOT Gobi!) *** tar.gz (See included slides)



WESNESDAY Referatsthemen (name: topic)


Date Topic Materials Hausarbeit Received
November 11th Beilmann: Focused Web Crawling slides yes
November 11th Papadatos: Fine-grained NER classes slides yes
November 18th Vila Leiva: Distant Supervision for NER slides yes
November 25th Maier: NER Amazon Mechanical Turk slides yes
November 25th Zap: Domain Adaptation slides yes
December 9th Fuchs: NER Twitter slides yes
December 9th Pelyak: Stanford NER Pipeline slides yes
December 16th Ullrich: OpenNLP NER Pipeline slides yes
December 16th Preißner: Coreference (Literature) slides yes
December 23rd Akhaladze: Disasters in Social slides yes
December 23rd Greth: IE Epidemics slides yes
January 13th CANCELLED (by presenters)
January 20th Göze: Multilingual slides yes
January 20th Kellner: Summarization slides yes




THURSDAY Referatsthemen (name: topic)


Date Topic Materials Hausarbeit Received
November 5th Baatarkhuu: History of IE slides yes
November 5th Bilan: Web Scraping, a Practical Example slides yes
November 19th Plötz: Fine-grained NER classes slides yes
November 19th Braß: Distant Supervision for NER slides yes
November 26th Mironova: Rule-based IE vs. Statistical slides yes
November 26th Glazkova: NER Amazon Mechanical Turk slides yes
December 10th Jacob: Domain Adaptation slides yes
December 10th Falkner: NER Twitter slides yes
December 17th Pham: NER Bio slides yes
January 14th Ivshina: IE Epidemics slides yes
January 14th Taranenko: IE multilingual applications slides yes
January 21st Markovych: Stanford Coref Pipeline slides yes
January 21st Schick: Disasters in Social slides yes