我最近才知道這個工具叫做word2vec。對於我目前的工作,我需要找出與給定用戶相似的用戶。單個用戶擁有與其相關的實體,如年齡,資格,畢業/組織結構,已知語言和特定標籤列表。如果我們將這些實體/列中的每一個都視爲用戶的單詞的隨機塊,我們是否可以相應地計算該用戶的矢量值並使用這些值來推斷用戶之間的相似性?維基培訓向量能幫助我們獲得有意義的結果嗎?還有其他方法可以做到嗎?使用word2vec來計算用戶之間的相似度
2
A
回答
4
你需要的是一個簡單的無監督(或半監督)聚類算法。 word2vec及其預先訓練好的向量可能不是很有用,因爲機構等不太可能在其中。另外,似乎用戶的「方面」數量很少,因此您可以簡單地在矢量表示上使用聚類算法,其中矢量空間的每個維度都是這些方面之一(年齡,資格,組織等)。
如果您希望用戶的相似性反映這些方面的相似性(與精確相等)相反,像word2vec這樣的連續空間模型可能會有所幫助。
例如,如果您想將「Python專家」的資格認定爲「腳本專家」的近似值,那麼請轉到word2vec。但是,如果您在有限的預定義數量的方面中查找精確匹配,請使用簡單的聚類算法。
P.S.更詳細的Q &有關此主題的答案應在Cross Validated之上。
相關問題
- 1. 如何使用word2vec輸出向量來計算相似度?
- 2. 如何計算兩個單詞之間的餘弦相似度(matlab中的word2vec)?
- 3. 如何用LSA計算句子之間的相似度?
- 4. 使用SOLR計算兩個長度之間的「相似度」/「位數」
- 5. 計算不同長度的DataFrame列之間的Jaccard相似度
- 6. 如何使用word2vec通過給出2個單詞來計算相似距離
- 7. 使用Python計算餘弦相似度
- 8. 什麼是計算圖像區域之間相似度的常用算法
- 9. 方法來計算相似度
- 10. 如何計算兩列之間的餘弦相似度? - Python的
- 11. 如何計算標籤之間的相似度?
- 12. 計算兩個線條圖之間的相似度
- 13. 如何計算NLTK中synsets之間的最大相似度? -Python
- 14. 計算Lucene文檔和質心之間的相似度
- 15. 計算一組集合之間的相似度
- 16. 如何計算兩個張量之間的餘弦相似度?
- 17. 計算兩個句子之間的語法相似度
- 18. 計算數百萬個文檔之間的相似性度量
- 19. 如何計算查詢和文檔之間的相似度?
- 20. 計算兩個列表之間的相似度
- 21. 如何計算兩個license.txt文件之間的相似度?
- 22. n個實體之間的計算相似度
- 23. 試圖計算搜索詞之間的相似度
- 24. 計算多個詞典之間的相似度「分數」
- 25. 選擇閾值來計算matlab中兩幅圖像之間的相似度
- 26. word2vec的餘弦相似度大於1
- 27. 計算餘弦相似度
- 28. 使用點積來計算兩個向量之間的角度
- 29. 項目的協同過濾算法來計算相似度betweeb使用象夫
- 30. 句子相似度 - 如何使用WordNet計算subsumer的深度?