# Übungen zu Infrastruktur/gitlab/wittdata ## 1. gitlab und Deploykette * Kopieren Sie den .zip File in ihr Homeverzeichnis: https://www.cis.uni-muenchen.de/kurse/max/wast/data/wittdata_open.tar.zip * unzippen und untaren sie die Dateien (Windows 7zip) Unix (unzip, tar) * Wechseln Sie in das entpackte Verzeichnis von wittdata_open * nun wechseln Sie in den Ordner `deployment` * Finden sie die XML Files der Edition * nun löschen sie die vorverarbeiteten Files mit `make clean` * nun starten sie `make deploy`und beoachten Sie den Ablauf der Deploy Kette ## zu 1. Lösung: Bei Ablauf der Deploykette stellen Sie fest, dass im Container zahlreiche Libraries, Compiler, Programme fehlen, die sie nachinstallieren müssen: ``` docker load -i wittsim.tar docker run -it wast/wittsim /bin/bash docker run -v :/data -it wast/wittsim /bin/bash an example: docker run -v C:\Users\max\my_wittfind\wittdata_open:/data -it wast/wittsim /bin/bash ``` Nun sind sie im wittsim Container als Nutzer "root" in einem Debian-Linux System. Nun können linux Befehle, Installationen, python Programme usw. starten. Ihr lokales Verzeichnis ist im Container im Volume "/data" verfügbar. Wenn sie weitere Pakete im Container installieren müssen, z.B. für die Aufgabe zur Infrastruktur, dann geben Sie in der Docker folgende Befehle ein. ``` # apt-get install update # apt-get install libxml2-utils # pip3 install lxml # cpan -i HTML::Parser ### Es fehlt noch JAVA und der SAXON Parser .... nun: # cd /data # cd /deployment # make clean # make deploy ``` ## 2. xml - Files und Wohlgeformtheit * finden Sie XML Fehler in folgendem xml Dokument: ```xml [DRAFT!] (2009-): Wittgenstein TS 213: Ts-213.xml Ludwig Wittgenstein Alois Pichler Wittgenstein Archives at the University of Bergen (WAB) das ist der Satz AAA nnn das ist der Satz BBB nnn Don't forget me this week-end das ist der Satz XAAA nnn das ist der a+b Satz XBBB nnn Don't forget me this weekend ``` ## zu 2. Lösung: nutzen Sie die WEB-Page: https://www.xmlvalidation.com/?L=2 ```xml [DRAFT!] (2009-): Wittgenstein TS 213: Ts-213.xml Ludwig Wittgenstein Alois Pichler Wittgenstein Archives at the University of Bergen (WAB) das ist der Satz AAA nnn das ist der Satz BBB nnn Don't forget me this week-end das ist der Satz XAAA nnn das ist der a+b Satz XBBB nnn Don't forget me this weekend ``` ## XML- Texte Kopieren Sie aus dem wittdata_open Repository die Editionsdatei `Ms-114_OA_NORM.xml` in ihr Homeverzeichnis und löschen Sie aus dem XML-File ab Absatz 4 alle Absätze. Speichern Sie die ge+nderte Datei unter dem Namen `Ms-114_OA_NORM_small.xml`. Arbeiten Sie mit dem online Tool oxgarage, der TEI-P5 Assozation: https://oxgarage.tei-c.org/ und konvertieren Sie ihre kleine Datei `Ms-114_OA_NORM_small.xml` in ein Dokumentformat, das ihnen Oxgarage anbietet.