我是hadoop和mapreduce的新手。我在hadoop Mapreduce中運行數據時遇到問題。我想要以毫秒爲單位給出結果。有什麼方法可以在毫秒內執行我的Mapreduce作業嗎? 如果不是,那麼hadoop mapreduce在完全分佈式多羣集(5-6個節點)中可以採用的最短時間是多少。 要在hadoop mapreduce中分析的文件大小約爲50-100Mb 程序是用Pig.Any suggesstions編寫的?MapReduce作業所花費的時間
-1
A
回答
0
這是不可能的(afaik)。 hadoop並不意味着實時的東西。它最適合批量作業。 mapreduce框架需要一些時間來接受和設置工作,這是你無法避免的。我不認爲這是一個明智的決定,讓超高端機器建立一個hadoop集羣。另外,框架在實際開始工作之前還必須做一些事情,比如創建數據的邏輯分割。
+0
感謝您的建議。 – 2013-03-22 04:15:18
1
用於即時查詢數據使用Imapala,Apache Drill(WIP)。演習根據Google Dremel。
Hive作業被轉換成MapReduce,因此Hive也是批處理方式,而不是實時的。儘管如此,許多工作正在改進Hive的性能(1和2)。
相關問題
- 1. 總共花費的時間和所有線程所花費的平均時間
- 2. 加載uiscrollview所花費的時間
- 3. 計算僅在工作時間內日期之間所花費的時間
- 4. 花費file_get_contents的時間
- 5. 花費的實際時間
- 6. 使用System.currentTimeMillis所花費的時間在android上不能工作
- 7. 執行Hadoop作業所耗費的時間
- 8. MagicalRecord節省花費時間
- 9. MDX查詢花費時間
- 10. sqlite3需要花費時間
- 11. WebRequest.GetResponse()花費太多時間
- 12. :app:transformClassesAndResourcesWithProguardForRelease花費太長時間
- 13. Selenium webdriver find_element_by_xpath花費時間
- 14. 在json中花費時間
- 15. ViewResult.ExecuteResult花費太長時間
- 16. GraphAlgoFactory.allSimplePaths花費很多時間
- 17. 當hystrix超時時,如何打印所花費的時間?
- 18. 執行%/ * + - 操作所花的時間
- 19. 如何計算java中的服務所花費的總時間?
- 20. 剖析MapReduce作業
- 21. HbaseTestingUtility和MapReduce作業
- 22. Mapreduce - 序列作業?
- 23. SecondaryNamenode和MapReduce作業
- 24. 多個MapReduce作業
- 25. Python:如何衡量等待I/O所花費的時間?
- 26. AS 2.0和gradle 2.0第一次運行所花費的時間
- 27. 查找一天中所有花費時間的總和
- 28. 使用C#在asp.net中處理請求所花費的時間
- 29. 測量API調用所花費的時間
- 30. 如何記錄jdbc組件所花費的時間
得到一個真的非常非常快的電腦。 – 2013-03-21 19:15:30
感謝您的建議。 – 2013-03-22 04:15:47