我已經通過curl命令安裝了solr和indexd並執行了搜索活動。現在我想在hadoop上部署它,並在文件被推送到存儲目錄時自動建立索引。我對Hadoop完全陌生,不知道。那麼任何人都可以向我介紹這一點?非常感謝。solr on hadoop的集成
-1
A
回答
-1
0
如果您不太瞭解底層技術,最好查看專門將多個軟件包放在一起的供應商產品,並提供圍繞其特定組合的培訓材料。
具體來說,我會建議看看像CDH from Cloudera。它包括Hadoop,Solr和許多其他的東西,比如Hue。
0
有些方法可以讓文件在目錄中登錄時自動進行索引。
使用curl - 編寫shell腳本並將其作爲cron運行。
使用Oozie - 創建shell操作並計劃它。
我希望morpline /水槽solr水槽可能工作。
注意:如果您發現有關3的解決方案,請分享。
乾杯, 卡納安
-1
你可以看到的Solr參考指南(HDFS上運行SOLR)是 https://cwiki.apache.org/confluence/display/solr/Running+Solr+on+HDFS
Solr的有寫作的支持和閱讀它的索引和事務日誌文件到HDFS分佈式文件系統
要使用HDFS,而不是一個本地文件系統,你必須使用Hadoop 2.x的
你需要指示Solr使用HdfsDirectoryFactory。還有幾個額外的參數需要定義。這些可以通過三種方式設置:
1.通過bin/solr腳本的通過JVM參數。每次你用bin/solr啓動Solr時都需要傳遞這些信息。
2.修改solr.in.sh(或Windows上的solr.in.cmd)以在使用bin/solr時自動傳遞JVM參數,而無需手動設置它們。
3.定義solrconfig.xml中的屬性。這些配置更改需要爲每個集合重複,因此,如果您只希望將某些集合存儲在HDFS中,那麼這是一個不錯的選擇。
相關問題
- 1. Cassandra-Hadoop集成
- 2. MongoDB Hadoop集成
- 3. 的Solr/Carrot2集成
- 4. Zookeeper Solr集成
- 5. Ruby on Rails的集成Apache Solr實現搜索文件
- 6. 集成Hadoop和HDF5
- 7. Hadoop和HBase集成
- 8. 微軟Hadoop集成
- 9. Hadoop和MySQL集成
- 10. 集成MONGODB和SOLR
- 11. MongoDB與Solr集成
- 12. 蒂卡Solr的集成
- 13. mongo-hadoop集成問題
- 14. Hadoop Cassandra集成設計
- 15. Rails + Apache solr分類集成
- 16. Solr 6和Nutch 2.3.1集成
- 17. 將Solr與Mediawiki集成
- 18. Apache Cassandra與Apache Solr集成
- 19. Solr和eXist-db集成
- 20. Apache Nutch和Solr集成
- 21. 將wordnet與solr集成
- 22. Lucene.NET/SOLR與ASPDOTNETSTOREFRONT(ASPDNSF)集成
- 23. 方法集成solr和mysql
- 24. 將solr與mySql集成
- 25. 使用PHP集成Solr
- 26. Hadoop On Demand
- 27. 的Apache Hadoop和Eclipse的集成
- 28. 在亞馬遜網絡服務和本地集成Solr + Hadoop和Nutch + Hbase
- 29. Django的集成SOLR和Nutch的
- 30. Jira On Demand與Bamboo集成