2012-11-17 168 views
8

我已經開始使用nutch和solr工作,並且在集成Solr和Nutch時遇到了問題。我跟着這個教程:http://wiki.apache.org/nutch/NutchTutorial後使用: bin/nutch crawl urls -solr http://localhost:8983/solr/ -depth 3 -topN 5 Nutch的顯示信息:索引在索引數據庫中搜索索引數據庫時出錯

java.io.IOException: Job failed!

和Solr是顯示:

SEVERE: org.apache.solr.common.SolrException: ERROR: [doc=http://nutch.apache.org/] unknown field 'host'

我認爲,原因可能是缺少「主機」場$ SOLR_HOME/example/solr/conf/schema.xml,但它在那裏。 我會非常感謝您的幫助。

+3

您是否將Nutch架構複製到SOLR? cp $ {NUTCH_RUNTIME_HOME} /conf/schema.xml $ {APACHE_SOLR_HOME}/example/solr/conf/ –

+0

是的,我沒有複製過。 – user1831647

+2

檢查主機是否在架構中定義。停止Solr。刪除數據目錄。啓動Solr。再試一次。 –

回答

2

在Nutch端更改配置不會影響Solr的模式。您必須在Solr的schema.xml中定義該字段。