我有一個響應系統,我試圖獲得它,所以你可以輸入一個字符串,並通過循環每個字符串並通過預定義的問題測量Levinshtein距離並使用一些其他算法。如何檢測包含任意字符串的模式?
例如:如果您輸入「嗨,你好嗎?」它會搜索其數據庫中相同或非常相似的內容(如「你好,你好嗎?」)。但我希望它能夠檢測是否正在使用取決於環境的特定短語,如:
「給我10個餅乾。」現在,我不想在數據庫中添加所有可能數量的cookie。那是不可能的。因此,在數據庫中,它會是這樣的:
「給我[個]餅乾。」我如何檢測模式?請記住,我也將使用字符串模式作爲其他響應。
嗯。任何Java示例?圖書館? :I – ColonelHedgehog 2014-09-23 19:08:05
帶有模糊查詢的Lucene看起來不錯,但我無法告訴你比你自己可以找到的一些研究更多。 – bidusurf 2014-09-25 03:25:00