next up previous
Nächste Seite: Vergleich von Termen und Aufwärts: index Vorherige Seite: Vergleich von zwei Termen

Vergleich von zwei Dokumenten (Interner Vergleich)

Das Skalarprodukt zwischen zwei Spalten-Vektoren von $A_k$ gibt an, zu welchem Grad zwei Dokumente ein ähnliches Profil bzgl. Termenvorkommen haben.

$\displaystyle A_k^TA_k = D_k(S_k)^2D_k^T $

Hier wird entsprechend die $ i,j$-Zelle von $ A_k^TA_k$ berechnet. Analog zum Vergleich zwischen zwei Termen, wird jetzt das Skalarprodukt zwischen den $i$-ten und $j$-ten Reihen der Matrix $ D_kS_k$ berechnet. Die Reihen dieser Matrix stellen die Koordinaten für die Dokumente dar, so dass es sinnvoll ist, das Skalarprodukt als Vergleichsmaß hinzuzuziehen.