2017-05-04 85 views
0

我想要使用相似性(也許餘弦)聚類一些句子,然後可能使用分類器將文本放入預定義的類。Word2vec分類和聚類tensorflow

我的想法是使用tensorflow生成嵌入詞,然後爲每個句子取平均值。接下來使用聚類/分類算法。

tensorflow是否提供準備使用word2vec生成算法?

一包文字模型會產生一個好的輸出嗎?

回答

1
  • 沒有,tensorflow不提供準備使用的word2vec,但它確實有a tutorial on word2vec

  • ,字的包可產生令人驚奇的良好的輸出,(但不是狀態的最先進的)和具有可令人驚訝更快的益處。我有少量數據(成千上萬的句子),並且分類的F1分數> 0.90。

+0

那麼我發現Tensorflow沒有準備好用於word2vec或手套。他們提供了一個用於實現word2vec模型的教程。我看了一下DL4J(JAVA),我想我現在要堅持下去。 – LonsomeHell