2015-07-01 32 views
-1

請指導我如何衡量文本數據聚類的相似性,對於我們可以使用歐氏距離度量或任何其他距離度量來衡量的數字數據。數據是用於從網站收集的搜索的關鍵字,第二個數據集是一些搜索返回的片段的集合。相似性的意義也應該相似。檢查文本數據之間的相似度

+0

閱讀**任何關於文本挖掘的書**。或者答案會和這本書一樣長。 –

回答

0

閱讀關於tf-idf和餘弦相似度。

相關問題