next up previous
Nächste Seite: Informations-Filterung Aufwärts: Weitere Anwendungen Vorherige Seite: Sprachübergreifendes Retrieval

Synonymerkennung, Wort-Clustering

Ein Versuch von LANDAUER und DUMAIS (1994) ergab, daß ein Multiple-Choice-Test zur Synonymen-Findung von LSI ebenso gut bestanden wurde wie von zu Vergleichszwecken herangezogenen Studenten: Für 80 englische Wörter mußte ein passendes Synonym aus einer Liste von jeweils vier anderen englischen Wörtern erkannt werden. Für LSI wurde dazu eine Term-Dokument-Matrix aus 30.473 Artikeln einer Enzyklopädie erstellt (61.000 Terme) und der LSI-Analyse unterzogen. Danach wurde die Ähnlichkeit des in Frage stehenden Terms mit den vier zur Auswahl stehenden durch Vergleich der Vektoren-Distanzen ermittelt. In 64% der Fälle wurde das korrekte Synonym erkannt, dieselbe Leistung wurde von den Studenten erbracht.