next up previous
Nächste Seite: Vergleich von zwei Dokumenten Aufwärts: index Vorherige Seite: Geometrische Interpretation des SVD-Modells

Vergleich von zwei Termen (Interner Vergleich)

Das Skalarprodukt zwischen zwei Reihen-Vektoren von $ A_k$ gibt an, zu welchem Grad sich die Vorkommenmuster von zwei Termen in der Dokumentensammlung ähneln.

Die Multiplikation von einer Matrix $M$ mit ihrer Transponierten $ M^T$ ergibt eine quadratische symmetrische Matrix, die in drei Matrizen zerlegt werden kann: Matrix $ EV$ mit den Eigenvektoren, Diagonalmatrix $ EW$ mit den Eigenwerten und die Transponierte von der Matrix $ EV$. Deswegen kann man schreiben:

$\displaystyle A_kA_k^T = T_k(S_k)^2T_k^T $

Da $ (T_kS_k)^T = S_kT_k^T$ bedeutet dies, dass die Zelle $ i,j$ der Matrix $ A_kA_k^T$ mittels des Skalarprodukts zwischen den $i$-ten und $j$-ten Reihen der Matrix $ T_kS_k$ berechnet werden kann. Wenn man also die Reihen von der Matrix $ T_kS_k$ als die Koordinaten für die Termen betrachtet, dann kann man auch das Skalarprodukt zwischen zwei Termvektoren als Vergleichsmaß zwischen diesen beiden Vektoren (= Termen) anwenden.

Da die Matrix $ S_k$ diagonal ist, besteht der einzige Unterschied zwischen dem Heranziehen von $ T_k$ bzw. $ T_kS_k$ als Koordinatenmatrix in der Streckung oder Schrumpfung der Achsen um den jeweiligen Wert der Diagonalelemente von $ S_k$.


next up previous
Nächste Seite: Vergleich von zwei Dokumenten Aufwärts: index Vorherige Seite: Geometrische Interpretation des SVD-Modells