2011-05-23 57 views
3

正如我在標題中所說的,我想在突出顯示時搜索完整句子。Solr突出顯示:提取完整句子

其實,我得到的結果是在一個詞的中間被切斷。

例如,如果我正在搜索單詞「完成」,我得到ying in title, i want to get a complete sentence wh,但我想要完整的句子As I'm saying in title, i want to get a complete sentence when i search with highlighting

我已經試過使用「碎片」,但我沒有任何結果。

任何人都可以幫助我嗎?

感謝和抱歉我的英語。

+0

你能舉個例子,目前的行爲是什麼,你的目標是什麼? – 2011-05-24 11:47:32

+0

當我使用突出顯示時,我得到一個單詞中間的句子。如果我正在爲例如「完整」而進行研究,那麼我會得到「英文標題,我想得到一個完整的句子」,但我想要完整的句子「正如我在標題中所說的,我想要在我搜索突出顯示「。 – bobosh 2011-06-14 07:33:14

+0

或者,如果我不能有一個完整的句子,我想單詞不被削減。 – bobosh 2011-06-14 11:59:04

回答

0

我想你找到你的答案在這裏:http://wiki.apache.org/solr/HighlightingParameters

看看參數hl.snippets和hl.fragsize,wehere您可以定義返回的片段的長度 - 所以你可以設置的值到字段大小(如果字段不那麼大)。

你的情況的其他有趣的參數是hl.fragmenter

+0

我知道這個參數,但是單詞被剪切...我不能使用完整的字段,因爲很多文檔如pdf,doc都被編入索引。 – bobosh 2011-06-14 12:18:19

+0

但我不知道hl.fragmenter參數。你有一些例子嗎? – bobosh 2011-06-14 12:21:22

+0

看看這個:http://stackoverflow.com/questions/364301/solr-using-regex-fragmenter-to-extract-paragraphs – 2011-06-14 12:56:51

1

另外,請檢查您是否請求處理或查詢參數hl.useFastVectorHighlighter設置爲true。如果它生成摘要的字段未使用維基中提及的正確術語設置進行設置,則可能會按照您的描述切割。

+0

我們對'FastVectorHighlighter'有同樣的問題:它在開始時經常會截斷這個詞。我懷疑'org.apache.lucene.search.vectorhighlight.SimpleFragListBuilder'是問題的根源,它似乎在片段的開頭添加了6個字符的邊距。無論如何,你可以用'margin = 0'來提供你自己的'FragListBuilder'實現來解決這個問題。 – raymi 2011-07-01 08:11:15

0

得到幾乎相同的問題切詞。正如我剛剛通過here所提到的那樣,您可以使用另一個BoundaryScanner。 這給了我完美的結果。