next up previous
Nächste Seite: Vorarbeit, LSI-ähnliche Versuche Aufwärts: Vergleich mit anderen Retrieval-Methoden Vorherige Seite: CISI: Sammlung von Abstracts

TREC: Über 1 Million Dokumente aus sehr unterschiedlichen Bereichen

TREC 3ist eine Sammlung von mehr als 1 Million Dokumente, 200 Queries und händischen Relevanz-Beurteilungen 4. Hier wurden keine detaillierten Tests der systematische Vergleiche mit anderen Retrieval-Verfahren durchgeführt; aber Versuche mit LSI ($ k=200$) lieferten recht ermutigende Ergebnisse (bessere jedenfalls als andere Retrieval-Verfahren). Dabei wurde die Term-Dokument-Matrix für 70.000 Dokumente und 90.000 Terme erzeugt, die restlichen Dokumente erhielten Vektoren mit Hilfe des Fold-In-Verfahrens.