我有一個問題..我有一個程序寫在Netbeans中。該程序從cassandra讀取數據並將結果寫入其中。我的程序根本不是MapReduce。我執行程序並從中創建一個.jar文件。現在,我想知道我是否可以在Hadoop中執行它? 實際上,我想知道我可以在Hadoop中運行非MapReduce程序嗎?在hadoop中運行非mapreduce程序
回答
您可以將此程序設計爲在Hadoop v2上作爲紗線應用程序運行。這需要重新設計您的應用程序以適應Yarn範例。如何做到這一點的例子如下:Writing App Framework on Yarn
這不是一個簡單的練習。另外,如果您對使用Hadoop感興趣,我會考慮簡單地重寫您的應用程序以使用專門爲Hadoop編寫的HBase(Cassandra的另一個No-SQL Columnar數據庫競爭對手)。它將您的查詢請求轉換爲自動調用的MapReduce。
注:「不是一個簡單的練習」。單獨運行Hadoop將無助於你。你的問題必須是map-reduce-able。 – duffymo
「YARN代表」Yet-Another-Resource-Negotiator「,它是一個有助於編寫任意分佈式處理框架和應用程序的新框架。」 –
「YARN是任何形式的分佈式應用程序運行的通用平臺,而MR2是一種在YARN之上運行MapReduce框架的分佈式應用程序。」 http://blog.cloudera.com/blog/2012/10/mr2-and-yarn-briefly-explained/ –
這個問題已經很久了,但從未被回答。總之,兩個項目正在調查這個問題:
阿帕奇滑塊(孵化):http://slider.incubator.apache.org/
和
阿帕奇無數(孵化):http://myriad.incubator.apache.org/
滑塊主要由Hortonworks贊助,而無數的一個由PayPal提供大量幫助的MapR/Mesosphere項目。
- 1. 在Hadoop中運行非mapreduce工作
- 2. Hadoop mapreduce - reducer未運行
- 3. 在hadoop集羣上運行mapreduce java程序
- 4. 在hadoop和mapreduce上運行R腳本
- 5. 無法在Hadoop上運行MapReduce作業
- 6. 在Hadoop集羣上運行mapreduce jar
- 7. Hadoop mapreduce編程
- 8. Hadoop:無法運行mapreduce程序..java.io.IOException:錯誤= 12
- 9. hadoop mapreduce程序中的錯誤
- 10. java.lang.NoClassDefFoundError在Hadoop的基礎的MapReduce程序
- 11. 運行mapreduce hadoop工作時,應用程序在yarn UI中沒有顯示?
- 12. MapReduce Hadoop運行時字符串異常
- 13. 如何運行Hbase和Hadoop mapreduce
- 14. Hadoop:無法運行MapReduce作業(python)
- 15. 使用Hadoop Streaming API運行java MapReduce
- 16. 錯誤運行的hadoop MapReduce的例子
- 17. 的Hadoop MapReduce的數據流不運行
- 18. Hadoop mapreduce運行速度很慢
- 19. ClassNotFoundException的運行的Hadoop/MapReduce的
- 20. 在僞分佈式hadoop中並行運行的Mapreduce任務
- 21. Hadoop無法運行程序
- 22. 運行Hadoop應用程序
- 23. 如何運行Hadoop程序?
- 24. Hadoop中的MapReduce
- 25. 在hadoop mapreduce
- 26. Hadoop MapReduce程序在Eclipse中運行良好,但在導出爲.jar文件時運行不正常
- 27. hadoop-2.2.0下運行的hadoop程序能在hadoop-1.2.1下運行嗎?
- 28. 在Hadoop中向Cassandra輸出一行Mapreduce
- 29. Hadoop MapReduce - 在文件系統上執行程序但不與HDFS
- 30. hadoop mapreduce
爲什麼? Hadoop在這種情況下帶來了什麼好處?只是HDFS? – duffymo
不,我不知道..我認爲它會加快程序執行時間。所以,你的意思是這個目標恰好發生在Hadoop中的MapReduce框架中? –
爲什麼運行Hadoop(一種用於在羣集上執行大規模並行化問題的map reduce框架)使得非並行化問題比在串行機器上運行得更快?那麼您不明白map reduce或Hadoop的作用。 – duffymo