Word2vec是一個開源工具,用於計算Google提供的單詞距離。可以通過輸入單詞並根據相似性輸出排名單詞列表來使用它。例如如何使用word2vec通過給出2個單詞來計算相似距離
輸入:
france
輸出:
Word Cosine distance
spain 0.678515
belgium 0.665923
netherlands 0.652428
italy 0.633130
switzerland 0.622323
luxembourg 0.610033
portugal 0.577154
russia 0.571507
germany 0.563291
catalonia 0.534176
不過,我需要做的是通過給予2個字來計算相似距離。如果我給「法國」和「西班牙」,我怎麼能得到0.678515的分數,而不用通過給出'法國'來閱讀整個單詞列表。
如果在這方面很有用,請參閱[這裏](http://radimrehurek.com/gensim/models/word2vec.html)使用由原始word2vec c語言實現創建的矢量文件。 – matanster
@Satarupa Guha:這種相似性功能是什麼?這是餘弦嗎? –
是的,這的確是餘弦相似函數。 –