我有一個獅身人面像服務器來索引一個Django應用程序的MySQL數據庫。我的搜索工作正常,但我的內容包括醫療單詞/短語。因此,例如,我需要尋找「dvt」以匹配「深靜脈血栓形成」甚至「深靜脈血栓形成」。我查看了文檔並查看了「wordforms」和「morphology」的選項。我應該使用哪些(或其他)?另外,什麼會倒退?即搜索「深靜脈血栓形成」/「深靜脈血栓形成」將與「dvt」匹配。我如何處理獅身人面像搜索中的單詞形式
此外,我將不勝感激關於如何設置這些建議,因爲我是一般的獅身人面像新手。
我有一個獅身人面像服務器來索引一個Django應用程序的MySQL數據庫。我的搜索工作正常,但我的內容包括醫療單詞/短語。因此,例如,我需要尋找「dvt」以匹配「深靜脈血栓形成」甚至「深靜脈血栓形成」。我查看了文檔並查看了「wordforms」和「morphology」的選項。我應該使用哪些(或其他)?另外,什麼會倒退?即搜索「深靜脈血栓形成」/「深靜脈血栓形成」將與「dvt」匹配。我如何處理獅身人面像搜索中的單詞形式
此外,我將不勝感激關於如何設置這些建議,因爲我是一般的獅身人面像新手。
您將需要提供您自己的單詞/術語同義詞列表,以用於查詢擴展。
由於Sphinx目前不支持查詢中的同義詞擴展,因此在將其提交給搜索引擎之前,需要根據同義詞列表來處理該查詢。
因此,使用你的例子:
用戶查詢: 'DVT修復程序'。
服務器接收查詢並根據其同義詞列表檢查每個術語。
服務器找到一個匹配,並添加「深靜脈血栓形成」查詢。
服務器向搜索引擎提交新擴展查詢'dvt深靜脈血栓修復程序'。
最後,如果建成獅身人面像詞幹是做自己的工作,你不應該有支持「靜脈」和「靜脈」作爲單獨的條款,因爲它們都應該幹到同一個術語。如果情況並非如此,那麼您可能需要做額外的預填詞來處理特定於您的語料庫的詞語(醫學術語)。