2017-02-13 32 views
1

我正在玩FastText,https://pypi.python.org/pypi/fasttext,它與Word2Vec非常相似。由於它似乎是一個相當新的圖書館,還沒有建立很多功能。我想知道如何提取形態相似的單詞,例如:model.similar_word(「dog」) - > dogs。但是沒有內置函數。如何使用FastText查找類似的單詞?

如果我鍵入model [「dog」],我只能得到向量,可能用於比較餘弦相似度model.cosine_similarity(model [「dog」],model [「dogs」]]。使某種循環,然後在文本做對所有可能cosine_similarity這將需要一些時間..

回答

7

使用gensim,使用load.word2vec模型加載fastText訓練好的.vec文件並使用most_similiar()方法找到相似的單詞!

2

您應該使用gensim加載model.vec再拿到類似的話:

m = gensim.models.Word2Vec.load_word2vec_format('model.vec') 
m.most_similar(...) 
相關問題