2016-11-19 49 views
0

我想實現句子相似度算法。是否有可能使用序列預測算法來實現它?如果可以採取什麼樣的方法或者是否有其他更適合句子相似度算法的方法,請分享您的觀點。處理句子相似度算法

回答

2

您可以嘗試將您的句子作爲單獨的文檔處理,然後使用傳統方法找到文檔之間的相似性。這裏使用sklearn回答了這個問題: Similarity between two text documents 如果你願意,你可以試着在tensorflow中實現相同的代碼。

我也強烈建議閱讀這個答案,覆蓋更復雜的方法:https://stackoverflow.com/a/15173821/3633250

+0

謝謝你提到的第一個鏈路上的信息馬克西姆。一是雖然更多的問題,是解決方案中提到類似word2vec轉換和應我放棄了使用序列預測的想法。 – Aniruddh

+0

@Aniruddh對不起,我沒有按照你的第二個問題 - 在你原來的問題中,沒有關於序列預測的內容。 –

1

你可以考慮使用Doc2Vec。每個句子(文檔)被映射到n維空間。爲了找到最相似文件

model.most_similar(「documentID」)

Reference