CIS
Centrum für Informations-
und Sprachverarbeitung

Aktuelles



Texte digital edieren und computerlinguistisch analysieren. Eine Einführung, Prof. Dr. Mark Hengerer und Dr. Max Hadersbeck

Tutor: Sebastian Still

Bachelor/Master Seminar
Zeit und Raum: Mo 16-18, Oettingenstr. 67, Rechnerraum Kalahari

Inhalt und Ziel der Veranstaltung
In dieser Veranstaltung werden historische Texte ediert und computerlinguistisch mit dem Tool UNITEX analysiert. Wir arbeiten am Rechner und verwenden Texte aus dme Umfeld von
Themen:
  • 6. Mai 2019 Einführung https://unitexgramlab.org/
    Hier finden Sie eine Dokumentation zur Arbeit mit UNITEX: (hier klicken)
  • 13. Mai 2019 Einführung Unitex/GramLab
  • 20. Mai 2019 OCR allgemein
  • 27. Mai 2019 OCR am Projekt Versailles > Squirrel, event. Fraktur-OCR-programm Prof. Schulz
  • 4. Juni 2019 Squirrel und Leopold Wilhelm und transfer Versailles nach Squirrel
  • 10. Juni 2019 Text + Positionsmarker im Squirrel

Wiki-Seite zur Veranstaltung (das Passwort dazu gibt es in der Veranstaltung): (hier klicken)

Literatur

  1. Hier finden Sie eine Dokumentation zur Arbeit mit UNITEX: (hier klicken)
  2. (hier zur Suchmaschine von Versaille)
  3. erste Seite: (hier zu einer Buchseite)

Voraussetzungen

Interesse an interdisziplinärer Zusammenarbeit sind notwendig

Scheinkriterien

Zum Erwerb eines Scheines muss eine Semesterabschlussaufgabe gelöst werden

Scripten

Skripten:

Aufgaben:

Blatt1: (Bearbeitung bis 13.5.19 16:00)  finden Sie (hier klicken)

Blatt2: (Bearbeitung bis 20.5.19 16:00)  finden Sie (hier klicken)

Blatt3: (Besprechung: bis 1.7.19 16:00)  finden Sie (hier klicken)

Blatt4: (Besprechung: bis 8.7.19 16:00)  finden Sie (hier klicken)

Blatt5: (Besprechung: bis 15.7.19 16:00)  finden Sie (hier klicken)