Methoden des Abgleichs
K. Schulz
Hauptseminar
Zeit und Ort:
Mo. 13-15 , Raum 0.13
Inhalt und Ziel der Veranstaltung
Die optische Charaktererkennung (OCR), unterstützt durch geeignete Verfahren
der Dokumentenanalyse, ist eine von mehreren Techniken, die eingesetzt werden,
um Papierdokumente in ein besser zugängliches elektronisches Format zu bringen.
Entgegen der naiven und landläufigen Ansicht ist das Problem der automatischen
Konversion von Papierdokumentenwegen der hohen Fehlerhaftigkeit der zur Verfügung
stehenden Verfahren auch noch heute in weiten Teilen ungelöst. In der Vorlesung werden
Techniken dargestellt,mit denen fehlerhaft erkannte Wörter anhand elektronischer Lexika
erkannt und korrigiert werden.
Vorlesungsskrip (Postscriptfile)
Voraussetzungen
abgeschlossenes Grundstudium
Scheinkriterium
regelmäßige und aktive Mitarbeit, Referat und Hausarbeit