Sommersemester 2010 am CIS
Dozent: Stefan Langer
Zu Beginn des Kurses steht eine Einführung in die Suchmaschinentechnologie mit Schwerpunkt auf linguistischen Verarbeitungskomponenten. Grundlage ist das Buch Manning/Raghavan/Schütze (2008). Anschließend sollen die Teilnehmerinnen und Teilnehmer dieses Kurses in Gruppenarbeit Komponenten einer Suchmaschine implementieren.
Voraussetzungen sind Grundkenntnisse in Lingustik, sowie Fertigkeiten in mindestens einer Programmiersprache (Perl, Python, Java oder C(++))
Voraussetzung für die Scheinvergabe sind:
Schriftliche Arbeit/Dokumentation: Nähere Informationen
Diese Seite können alle Seminarteilnehmer editieren! Wiki-Seite
Christopher D. Manning, Prabhakar Raghavan and Hinrich Schütze, Introduction to Information Retrieval, Cambridge University Press. 2008. Webseite
Tutorial on character encodings
Zeichensatzkodierungen in HTML
TextCat Sprachidentifizierer, mit einer Liste von Sprachenidenfizierungstools auf dem Netz