2011-07-06 39 views
2

我有一個關於Solr的和可能性問題,以實現定製的更新處理Solr的和自定義更新處理

基本上,情況是這樣的:

  • FIELD-A:我的主要領域
  • FIELD-B和FIELD-C:2個複製域,其中源代碼爲A

在FIELD-A存儲其值之後,作爲子字符串),並在索引時間之前存儲在FIELD-B和C中。我沒有使用DIH。

編輯:我通過Nutch的推着我的數據(忘了提)

至於我已經明白,copyfields索引之後觸發(但我不那麼肯定這一點)。

我已經讀過THROU the wiki page和我還是不明白了很多事情:

1)customupdateprocessor是conditionalcopyfield替代或做他們必須同時存在於我的Solr?

2)創建我的conditionalcopyfield jar文件後,我該如何在我的模式中聲明它?

3)如何修改我的solrconfig.xml以使用我的更新程序?

4)如果我選擇了錯誤的方式,任何建議表示讚賞,如果提供

我讀了很多的一些例子或有據可查鏈接更好(谷歌搜索和nabble的Lucene毫升),但有沒有這樣關於這個的很多文檔。我只需要爲我的兩個複製字段創建自定義更新程序,即

感謝所有提前!

+0

我剛剛通過irc與solr的開發者之一進行了一次談話,他幫我解決了這個問題。維基頁面(正如他也說的)很弱,所以當我完成時,我正在貢獻一個更新的版本。一旦完成,我會在這裏再次發佈解釋和新的wiki指南,這樣每個有我的問題的人都可以通過正確的路徑! –

回答

3

它不是很複雜..以下是我遇到的一個很好的鏈接,用於編寫自定義solr更新處理程序。

http://knackforge.com/blog/selvam/integrating-solr-and-mahout-classifier 

我在我的測試中測試了它,它工作的很好!

+0

謝謝!去年晚些時候,我實際上設法解決了這個問題,但實際上我需要分類算法!而且,這真是一個自定義更新處理程序的實用示例!這是一個2合1的答案!榮譽隊友! –

+0

很高興幫助 –