Q

solr on hadoop的集成

hadoop
solr

2014-04-04 67 views -1 likes

-1

我已經通過curl命令安裝了solr和indexd並執行了搜索活動。現在我想在hadoop上部署它，並在文件被推送到存儲目錄時自動建立索引。我對Hadoop完全陌生，不知道。那麼任何人都可以向我介紹這一點？非常感謝。solr on hadoop的集成

2014-04-04 vsh

A

回答

-1

要添加到亞歷山大的答案：有一個教程Cloudera搜索http://www.cloudera.com/content/cloudera-content/cloudera-docs/Search/latest/Cloudera-Search-User-Guide/csug_tutorial.html。

2014-04-05 19:58:45

0

如果您不太瞭解底層技術，最好查看專門將多個軟件包放在一起的供應商產品，並提供圍繞其特定組合的培訓材料。

具體來說，我會建議看看像CDH from Cloudera。它包括Hadoop，Solr和許多其他的東西，比如Hue。

2014-04-04 11:24:01

0

有些方法可以讓文件在目錄中登錄時自動進行索引。

使用curl - 編寫shell腳本並將其作爲cron運行。
使用Oozie - 創建shell操作並計劃它。
我希望morpline /水槽solr水槽可能工作。

注意：如果您發現有關3的解決方案，請分享。

乾杯，卡納安

2014-06-04 06:55:30 kannan

-1

你可以看到的Solr參考指南（HDFS上運行SOLR）是 https://cwiki.apache.org/confluence/display/solr/Running+Solr+on+HDFS

Solr的有寫作的支持和閱讀它的索引和事務日誌文件到HDFS分佈式文件系統

要使用HDFS，而不是一個本地文件系統，你必須使用Hadoop 2.x的

你需要指示Solr使用HdfsDirectoryFactory。還有幾個額外的參數需要定義。這些可以通過三種方式設置：

1.通過bin/solr腳本的通過JVM參數。每次你用bin/solr啓動Solr時都需要傳遞這些信息。

2.修改solr.in.sh（或Windows上的solr.in.cmd）以在使用bin/solr時自動傳遞JVM參數，而無需手動設置它們。

3.定義solrconfig.xml中的屬性。這些配置更改需要爲每個集合重複，因此，如果您只希望將某些集合存儲在HDFS中，那麼這是一個不錯的選擇。

2016-03-24 03:28:12

相關問題

11. MongoDB與Solr集成
12. 蒂卡Solr的集成
13. mongo-hadoop集成問題
14. Hadoop Cassandra集成設計
15. Rails + Apache solr分類集成
16. Solr 6和Nutch 2.3.1集成
17. 將Solr與Mediawiki集成
18. Apache Cassandra與Apache Solr集成
19. Solr和eXist-db集成
20. Apache Nutch和Solr集成
21. 將wordnet與solr集成
22. Lucene.NET/SOLR與ASPDOTNETSTOREFRONT（ASPDNSF）集成
23. 方法集成solr和mysql
24. 將solr與mySql集成
25. 使用PHP集成Solr
26. Hadoop On Demand
27. 的Apache Hadoop和Eclipse的集成
28. 在亞馬遜網絡服務和本地集成Solr + Hadoop和Nutch + Hbase
29. Django的集成SOLR和Nutch的
30. Jira On Demand與Bamboo集成