Methoden des Abgleichs

K. Schulz

Hauptseminar

Zeit und Ort:
Mo. 13-15 , Raum 0.13

Inhalt und Ziel der Veranstaltung

Die optische Charaktererkennung (OCR), unterstützt durch geeignete Verfahren der Dokumentenanalyse, ist eine von mehreren Techniken, die eingesetzt werden, um Papierdokumente in ein besser zugängliches elektronisches Format zu bringen. Entgegen der naiven und landläufigen Ansicht ist das Problem der automatischen Konversion von Papierdokumentenwegen der hohen Fehlerhaftigkeit der zur Verfügung stehenden Verfahren auch noch heute in weiten Teilen ungelöst. In der Vorlesung werden Techniken dargestellt,mit denen fehlerhaft erkannte Wörter anhand elektronischer Lexika erkannt und korrigiert werden.

Vorlesungsskrip (Postscriptfile)

Voraussetzungen

abgeschlossenes Grundstudium

Scheinkriterium

regelmäßige und aktive Mitarbeit, Referat und Hausarbeit