Nächste Seite: Methoden der Aktualisierung
Aufwärts: index
Vorherige Seite: Vergleich von Termen und
Die Anfragen werden ebenfalls als Vektor im
-Raum dargestellt und mittels
Kosinus mit den vorhandenen Vektoren verglichen. Da eine Anfrage auch als ein
Vektor von Termen aufgefasst werden kann, wird sie als ein Dokument
betrachtet, das in der Datenbasis noch nicht vorhanden ist. Deswegen werden
Anfragen auch als Pseudo-Dokumente bezeichnet.
Ziel ist es, die Anfrage so darzustellen, dass sie als eine weitere Reihe der
Matrix
behandelt werden kann. Dann wäre man in der Lage, sie mit den
anderen Dokumenten bzw. Termen entsprechend den weiter oben behandelten
Methoden zu vergleichen.
Die Formel lautet:
Als Beispiel betrachten wir eine Anfrage nach "application" + "theory" (jeweils die 2. bzw. 16. Reihe unserer Originalmatrix
). Hier die obige Formel mit den Daten aus der Anfrage:
Jetzt sind wir in der Lage, unsere Anfrage im Koordinatensystem darzustellen. Die Dokumente, die sich innerhalb des in Grau dargestellten Konus befinden, sind die Antwort-Dokumente. Der Winkel des Konus ist durch den vordefinierten Kosinuswert bestimmt (cos(0°) = 1, cos(90°) = 0).
Mittels geeigneter Wahl des Maßstabs (
bzw.
) kann man
die Anfrage dann rechnerisch mit den einzelnen Termen (äußerer Vergleich) bzw. Dokumenten (innerer Vergleich) vergleichen.