我對Hadoop和Hive頗爲陌生,並且希望能夠使用Hadoop輕鬆完成的一些示例,但Hive並不適合您。你可以用Hadoop做什麼是不可能的,或者很難做到Hive?
-1
A
回答
1
所有不是「關係型工作負載」的東西(例如,你也可以用SQL數據庫來做的東西)並不是非常適合Hive。 Hive可能總是有辦法做到這一點(主要是因爲UDF可用),但它不會「輕鬆」。
您正在區分「Hadoop」和「Hive」。然而,「Hadoop」是一個相當通用的術語:它可能意味着「HDFS」(分佈式文件系統),「YARN」(資源管理器)或「Hadoop」作爲谷歌建議的「Map Reduce」算法的實現。在比較Hadoop和Hive時,我假設你參考了「Map Reduce」。
我想說計算一個page-rank with MapReduce可能是相當惱人的蜂巢。另一個例子是計算TF-IDF with MapReduce。
1
TF-IDF可以使用Apache Hive和Hivemall擴展進行計算。 https://github.com/myui/hivemall/wiki/TFIDF-calculation
要計算TF-IDF,只需要2個視圖和1個查詢。簡單!
相關問題
- 1. 你無法用Angular.js做什麼,你可以用jQuery做什麼
- 2. 你可以用grep來做什麼,你可以用egrep做什麼?
- 3. 我不能用keytool做什麼,我可以用OpenSSL做什麼?
- 4. 你可以用hadoop-mapreduce-examples-2.2.0.jar做什麼?
- 5. 你可以用AppleScript做什麼?
- 6. 在NS2中可以做什麼以及不能做什麼?
- 7. 什麼是MD5CryptoServiceProvider,它可以做什麼?
- 8. 你能用System.DirectoryServices.Protocols.ExtendedRequest做什麼?
- 9. 有沒有什麼C++可以比D做得更好,或者D不能做到? (多繼承的例子)
- 10. 你可以在FQL中做什麼,你不能使用圖形API
- 11. 小蘋果可以做什麼和不能做
- 12. 表格可以做CSS定位不能做什麼?
- 13. ANSI到Unicode或者向後轉換:怎麼可能做到?
- 14. 我可以用Windows 8開發者許可證來做什麼?
- 15. Komodo Macro可以做什麼,如果可以,我該怎麼做?
- 16. FormCreate()中可能做什麼和不做什麼?
- 17. 什麼是可以做的,哪些不能由%完成?
- 18. VPS可以做什麼?
- 19. webkit可以做什麼?
- 20. Merlin Agent可以做什麼?
- 21. 很難做到mod重寫
- 22. 這個Objective-C(或可能是c)語法是做什麼的?
- 23. 你可以做implode。= in php?
- 24. 可搜索表格 - 你會做什麼?
- 25. 你如何知道你可以在api中做什麼?
- 26. 有可能做一個「SUM」子查詢或應該做什麼?
- 27. static_assert是做什麼的,你會用它做什麼?
- 28. 指針可以做什麼,否則不可能實現?
- 29. 做什麼:延遲做通知?或者爲什麼它不能正常工作?
- 30. 你可以用這些代碼做什麼樣的JUnit測試?