0
我有一個包含數百個問題和答案的單詞文檔我想要一種方式來搜索不知道使用的確切單詞的問題。有用於搜索的免費文字處理縮略詞或不同的方式詢問同樣的問題在文本文檔中搜索自由文本的工具
我有一個包含數百個問題和答案的單詞文檔我想要一種方式來搜索不知道使用的確切單詞的問題。有用於搜索的免費文字處理縮略詞或不同的方式詢問同樣的問題在文本文檔中搜索自由文本的工具
兩個想法的任何工具或現有的庫:
IR技術是通用域名QA相當不錯的,特別是如果你的文檔很大。我使用elasticsearch索引文檔,並對索引進行查詢。
如果你能保持每個查詢的內存指數和計算相似度值(假設你的文件是不是很大),我很想嘗試這些短語和句子級的相似之處:https://github.com/CogComp/cogcomp-nlp/tree/master/similarity