2017-09-26 43 views

回答

1

兩個想法的任何工具或現有的庫:

  • IR技術是通用域名QA相當不錯的,特別是如果你的文檔很大。我使用elasticsearch索引文檔,並對索引進行查詢。

  • 如果你能保持每個查詢的內存指數和計算相似度值(假設你的文件是不是很大),我很想嘗試這些短語和句子級的相似之處:https://github.com/CogComp/cogcomp-nlp/tree/master/similarity