2014-07-01 121 views
0

我試圖檢查此功能是否可以用Solr實現。防止solr短語查詢被阻止或停用停用詞

我定義了一個文本字段,在查詢分析器,我等一StopFilterFactoryPorterStemFilterFactory定義。

我使用edsimax作爲請求處理程序。

我目前的執行情況下,如果我搜索:
Q = 「這是一個措辭查詢」這不是措辭

Lucene的查詢將是:(原諒我的僞語法)
text:「this??phras query」| text:this |文本:phras

哪裏是什麼我想獲得的是:
文字:「這是一個措辭查詢」 | text:this |文本:phras

換句話說,我想設置一個包裹短語加上引號是行爲:
如果沒有任何符號化整個短語將出現在它的文件將只匹配。

我明白,也許可以通過定義一個額外的領域,不會經歷任何處理,並增加它在edismax配置上的提升。

但這將返回不包含確切短語的文檔的匹配項。

這可以在Solr上實現嗎? 如何?

+0

除非你願意鼓搗edismax代碼以特殊方式對待短語查詢,我不認爲你會得到你想要的行爲。我可以問爲什麼停止詞的刪除困擾你嗎? –

+0

我在搜索引擎上得到的主要反饋是用引號搜索返回不相關的結果。特別是在搜索包含停用詞的錯誤代碼時。 – David

回答

2

如何將查詢的不同部分與單獨的字段進行匹配?或者通過fq篩選text_exact或通過常規搜索語法進行打分:text_exact:"this is a phrasing query" this is not phrasing其中最後的詞語應該根據默認搜索字段或qf iirc進行搜索。

+0

我想這是一個有效的選項。我希望得到某種配置或擴展參考,但我想這可能會工作 – David