CLARIN-D Kurationsprojekt

Dieser Workshop war Teil des CLARIN-D Projekts "Ausbau und Erweiterung eines Open-Source-Tools zur Nachkorrektur historischer OCR-erfasster Texte" (CLARIN-DE-FAG4-KP3, Laufzeit April 2015 - März 2016) und ist mit Ende März 2016 abgeschlossen. Diese Seite ist daher historisch und wird nicht mehr aktualisiert.

Der Abschlussbericht ist hier einsehbar.

Der aktuelle Projektstand ist auf Github unter CIS OCR Group verfügbar.

Referenz:
Uwe Springmann & Florian Fink (2016). CIS OCR Workshop v1.0: OCR and postcorrection of early printings for digital humanities. Zenodo. 10.5281/zenodo.46571 DOI

Workshop:
OCR und Nachkorrektur alter Drucke für die Geisteswissenschaften
OCR and postcorrection of early printings for digital humanities

Centrum für Informations- und Sprachverarbeitung (CIS)
Ludwig-Maximilians-Universität München

Announcement

Announcement (pdf)

Date

Monday 2015-09-14 10h to Tuesday 2015-09-15 17h

Location

Hauptgebäude der Ludwig-Maximilians-Universität München, Geschwister-Scholl-Platz 1, 80539 München, Hörsaal A022

Directions

Wege an die LMU

Program

Monday, 2015-09-14 Tuesday, 2015-09-15
10:00-10:20 Welcome, overview 09:00-10:00 M7: Tesseract: Practice
10:20-11:00 M1: Challenges & methods 10:00-11:00 M8: Abbyy Finereader: Practice
11:00-11:30 M2: Image acquisition & preprocessing 11:00-12:00 M9: The CIS error profiling technology
11:30-12:00 M3: Preprocessing: Practice
12:00-13:30 Lunch time 12:00-13:30 Lunch time
13:30-14:30 M4: How to transform incunabula: Theory 13:30-14:30 M10: PoCoTo: Theory
14:30-15:00 Break 14:30-15:00 Break
15:00-16:00 M5: How to transform incunabula: Practice 15:00-16:00 M11: PoCoTo: Practice
16:00-16:30 M6: Other OCR engines: Tesseract, ABBYY 16:00-16:15 Feedback & discussion
16:30-17:00 Wrap-up: day 1 16:15-16:30 Wrap-up
18:30- ?? Dinner, evening sessions ad lib.

Software requirements

Software to install on your laptop before the workshop to enable an active participation in the practice sessions

Additional data

You can browse and download the presentation slides, manuals, and data needed for the practice sessions here.