2015-01-08 100 views
0

所有:如何突出單段所有匹配的詞Solr中

現在,我使用SOLR亮點功能,但有一點我要問的是:

假設我要搜索的關鍵字基金和值:

fund AND value 

而且回亮點的部分是這樣的:

"highlighting": { 
    "blk_0019": { 
     "content": [ 
     "philosophy of the <em>fund</em> – <em>value</em> and turning point. \n \n MUSA was an orphaned" 
     ] 
    }, 
    "blk_0006": { 
     "content": [ 
     "Global Equities <em>Fund</em> Ltd. \n \n CONFIDENTIAL enclosed" 
     ] 
    } 
} 

的問題是我當然blk_0019和blk_0006同時具有資金和價值(顯然我使用基金和報告),因爲我設置hl.fragsize = 100,如果資金和價值在一個文件中位置不夠近,他們不能同時顯示在同一個片段中。在blk_0019中,solr突出了基金和價值,但在blk_0006中,只顯示了基金。

我怎樣才能顯示一個片段都匹配的,只是它們之間忽略文本.....像谷歌

也有一些小的問題是:

[1]如何指定在Solr中搜索大寫的單詞如Hello HELLO ?

[2]如何搜索全資AND(全部大寫「AND」將被認爲是邏輯運算符)

感謝

回答

1

這取決於你所使用的熒光筆。對於標準熒光筆,例如您可以設置hl.snippets=5(默認值爲1)。然後你會得到5片段(最多),每個片段的最大長度爲hl.fragsize

它們作爲多個值返回,因此您需要自己加入它們(例如,使用「...」)。

+0

感謝您的幫助。有一個問題我想知道:如何安排突出顯示結果的優先級?假設我想搜索:+ Fund OR(value USA),看起來+ Fund是一個非常重要的關鍵字,我明確想要在高亮結果中顯示它的匹配,但是如果文檔中的匹配位置超出hl.snippets,它可能未在結果中顯示,我如何配置以確保基金匹配結果始終可以在結果中顯示? – Kuan

+0

好問題。也許你應該看看https://cwiki.apache.org/confluence/display/solr/Postings+Highlighter。它通過對「段落」進行評分來進行良好的總結(因爲在這種情況下稱爲分段)。但要注意,它的工作原理完全不同。 – Simon

+0

謝謝,我研究這個。你能幫我解決關於solr查詢語法的另一個問題嗎? http://stackoverflow.com/questions/27865771/beginner-about-solr-boolean-operation-like-combination-of-and-or或 – Kuan

相關問題