有沒有一種方法可以查詢關鍵字並獲取前x個單詞量和下個x個單詞量?Solr - 抓取上一個/下一個X關鍵字的關鍵字
例
(搜索 「測試」)
AA BB CC DD EE FF GG HH II JJ KK LL測試毫米NN OO PP QQ RR SS TT ...
其中x爲5將返回
「HH II JJ KK LL試驗毫米NN OO PP QQ RR SS」
以「test」突出顯示。
或
(搜索 「測試」 和/或 「垃圾郵件」)
AA BB CC DD EE FF GG HH II JJ KK LL測試毫米ン垃圾郵件OO PP QQ RR SS TT ...
其中x爲5將返回
「HH II JJ KK LL試驗毫米NN垃圾郵件OO PP QQ RR SS TT」
以「test」和 「垃圾郵件」 突出顯示。
任何幫助將不勝感激。我一直在尋找正則表達式,但我在那裏很無能。這裏是我一直在使用的資源。另外,我包含$ ,.和其他隨機標點符號(試着用句子沿着隔離區走下去)。我們假設空間分開。
http://wiki.apache.org/solr/HighlightingParameters/
謝謝!
我的問題似乎來自我搜索文檔的方式。我將它分成70個字符(到最近的世界)。這有時會產生這樣的結果「等等等等等等等等等等......」===「等等等等等等等等」和「測試等等等等......」這將返回2個片段。我正在考慮按段落搜索(GAP - 保持上下文),然後手動移動電子標籤。我希望有一個更優雅的解決方案 – Cloud 2012-07-31 14:44:38
或者也許有一種方法來使用正則表達式來打破句子的片段? – Cloud 2012-07-31 14:45:54