Information Extraction - Lecture

Summary

Bei der Informationsextraktion (IE) geht es um die automatische Extraktion von Information aus Volltexten. Die Anwendungen erstrecken sich von der Unterstützung von Internet-Suchmaschinen bis hin zum automatischen Aufbau von Fachdatenbanken. Die Methoden reichen von der Analyse natürlicher Sprache über automatische Termerkennung bis zu automatischen Lernverfahren, wobei symbolische, statistische und hybride Methoden zum Einsatz kommen. Komplexe Informationsstrukturen können mit sogenannten Templates (Informationsmustern) repräsentiert werden. In der Veranstaltung werden verschiedene Anwendungen und Methoden für diverse Anwendungsdomänen betrachtet.

Inhalte:

In der Vorlesung wird zunächst der Begriff der Informationsextraktion in Abgrenzung zum Information Retrieval definiert. Dazu gehört auch, die Teilgebiete und Aufgaben der Informationsextraktion (IE) vorzustellen. Dabei wird konkret auf die einzelnen Probleme der IE eingegangen, bevor Ansätze und Verfahren zur Lösung dieser behandelt werden. Die Veranstaltungsteilnehmer werden lernen, wie die Architektur eines generischen IE-Systems aussieht, welche Komponenten es enthält, und auf welchen Ressourcen es aufbaut.

Lernziele:

Ziel ist es, die Probleme bei der automatischen Informationsextraktion aus Dokumenten zu verstehen und die notwendigen Komponenten und Ressourcen kennenzulernen.

Here is a link to the Seminar

Instructor

Alexander Fraser

Email Address: SubstituteMyLastName@cis.uni-muenchen.de

CIS, LMU Munich


Tutor: Fabian Dreer

Email Address: SubstituteFabiansLastName@cip.ifi.lmu.de


Schedule


Room BU101, Wednesdays, 16 to 18 (c.t.)



Date Topic Reading (DO BEFORE THE MEETING!) lecture slides
October 19th Introduction to Information Extraction pptx pdf
October 26th History/Related Fields, Sources, Regular Classes Read Sarawagi: Introduction (pages 1 to 21) pptx pdf
November 2nd Introduction to Evaluation, Rule-based NER Read Sarawagi: Rule-based (Chapter 2) pptx pdf
November 9th More evaluation, IE Tasks, Annotation pptx pdf
November 16th IR vs. IE and introduction to classification-based NER Read Sarawagi: Classification (Chapter 3) pptx pdf
November 23rd Decision Trees pptx pdf
November 30th Linear Models pptx pdf
December 7th Neural Networks (and Word Embeddings), Fabienne Braune     pdf
December 14th Relation Extraction, Matthias Huck
Review of Exercise 2
Read Sarawagi: Relationship Extraction     pdf
pptx pdf
December 21st Sentiment Analysis pptx pdf
January 11th Event Extraction and Multimodal Extraction pptx pdf
January 18th Open IE, Matthias Huck     pdf
January 25th Neural Networks for NER, Fabienne Braune     pdf
February 1st Review
February 15th Klausur *14:00* c.t., Hauptgebäude (Main LMU Building), Raum A 014.
April 19th Nachholklausur (probably 14:00 c.t., to be confirmed, room to be determined)


Literature:

Sunita Sarawagi. Information Extraction. Foundations and Trends in Databases, 1(3):261–377, 2008. Table of Contents