2011-10-30 30 views
0

我剛剛設置了Solr,索引了一些頁面(使用Nutch進行爬網),現在我可以搜索了。Solr可以索引句子而不是網頁嗎?

我現在需要將它改爲索引句而不是網頁。例如,我需要的結果是搜索「一個詞」並獲得包含「一個」和/或「詞」的所有句子的列表。

我是新來的Solr,所以任何指向我應該從哪裏開始實現這一點的指針將非常有幫助。這是否可能?還是有一個簡單的方法做到這一點,我錯過了?

回答

1

是的。 Solr索引'文檔'。您可以通過REST-ful端點向其發佈的內容定義文檔的內容。如果您一次推一個句子,則一次編制一個句子。

如果您的意思是'我可以推送文檔,將文檔拆分成句子並單獨編制索引',那麼我認爲Solr內部的答案不太容易。如果你使用的是Nutch,我建議把分割放入Nutch中,這樣它就可以一次提供一個句子給solr。

無論是分析鏈還是update request processors都沒有提供將文檔分解爲較小的文檔。您也可以考慮使用彈性搜索替代方案,但我沒有具體的知識,即有滑動的滑動杆可導致您的解決方案出現。

相關問題