2012-09-04 49 views
7

我有一個像這樣配置的SolrCloud:exploration of SolrCloud,區別在於我使用的是Solr 4.0.0 Beta。不久,配置:默認端口用ZooKeeper在SolrCloud中配置DataImportHandler

  • 的ZooKeeper 2181
  • 3在不同的端口

這只是用於測試目的運行的Solr的實例。所需的配置是3個ZooKeeper實例(每個Solr實例一個)。我設法用curl命令來索引一些XML文件。

問題:

  1. 如何配置諦/收藏?我設法改變了solrconfig.xml(config爲dataimport-handler),在lib中添加了適當的數據庫連接驅動程序,但是在solr admin中,我得到了「抱歉,沒有定義數據導入處理程序!」這些更改可以在zookeeper中看到(我看到data_config.xml),在solr管理面板中,我可以看到更新版本的solrconfig.xml。

  2. 針對Ubuntu 12.04 LTS在單臺或多臺計算機上進行solrcloud生產部署的任何優秀教程(與somthink類似於之前提到的所需配置)?

任何意見將不勝感激!提前致謝!

回答

4

通常,DIH配置與您在SolrCloud配置中使用單個Solr實例或多個實例無關。 DIH將在當前實例的Lucene索引中寫入數據,然後由zooKeeper在其他實例上進行擴展。

確保您DIH被propertly配置:

solrconfig.xml中,所有必要的庫被加載。這意味着,這兩個瓶子DIH:

<lib dir="../../../dist/" regex="solr-dataimporthandler-4.3.0.jar" /> 
<lib dir="../../../dist/" regex="solr-dataimporthandler-extras-4.3.0.jar" /> 

以及其他罐子,你可能需要(如數據庫的JDBC驅動程序,等等)。

仍然在solrconfig.xml中確保DIH處理程序申報,這樣的事情:

<requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler"> 
    <lst name="defaults"> 
     <str name="config">data-config.xml</str> 
    </lst> 
</requestHandler> 

最後,在DIH處理器(數據-config.xml文件)中聲明的配置文件應該是在與solrconfig.xml相同的「conf」目錄,並且應該有適當的內容,如:

<dataConfig> 

<dataSource type="JdbcDataSource" name="myDataSource" driver="oracle.jdbc.driver.OracleDriver" url="jdbc:oracle:thin:@someHost:1521:someDb" user="someUser" password="somePassword" batchSize="5000"/> 

<document name="myDoc" > 
    <entity name="myDoc" dataSource="myDatasource" transformer="my.custom.Transformer" query="select col1, col2, col3 from table1 where whatever" /> 
</document> 

</dataConfig> 
+1

是的,這對我也適用。我用solr多年,但獨立總是爲我剪下它。現在它沒有,solr雲對我來說是新的。我發現很難使橋接器理解配置存儲在zookeeper文件結構中。 –

相關問題