我開始與Hive合作。 我想知道是幹什麼用的查詢應爲格式中各表的格式: rcfile,orcfile,實木複合地板,分隔文本Hive文件格式的優缺點
1
A
回答
1
當你有很大量列的表,你會經常使用特定的列,RC文件格式將是一個不錯的選擇。而不是讀取整行數據,您只需檢索所需的列,從而節省時間。數據被分成若干組,然後分成若干組。
分隔文本文件是一般文件格式。
1
對於ORC文件格式,看看裏面有詳細的描述在這裏蜂巢文檔:https://cwiki.apache.org/confluence/display/Hive/LanguageManual+ORC
平面文件格式欄的形式存儲數據。 例如: Col1中col2的 A 1 B 2 的C 3
普通數據存儲爲A1B2C3。使用Parquet,數據被存儲爲ABC123。 木地板的文件格式,對https://blog.twitter.com/2013/dremel-made-simple-with-parquet
1
我看到有一對夫婦的答案的讀操作,但因爲你的問題沒有問任何特定的文件格式,答案涉及一個或其他文件格式。
有很多可以在Hive中使用的文件格式。值得注意的是AVRO,Parquet。 RCFile & ORC。如果您想比較這些文件格式的性能和空間利用率,可以在線提供一些很好的文檔。遵循一些有用的鏈接,將讓你走。
This link from MapR [They don't discuss Parquet though]
上面給出的鏈接將讓你去。我希望這回答您的查詢。
謝謝!
相關問題
- 1. CSS格式的優缺點
- 2. .htc文件的優缺點
- 3. 不同配置格式的優缺點?
- 4. 解析INI文件的優點/缺點
- 5. 頭文件的優點/缺點
- 6. PHP spl_autoload_register()風格的優點/缺點
- 7. 單獨戰爭文件的優缺點
- 8. 軟件分析模式 - 優缺點
- 9. 衛星組件 - 優缺點
- 10. StyleCop,優點/缺點
- 11. CouchDB的優缺點
- 12. XCODE4的優缺點?
- 13. CodeSmith的優缺點
- 14. Phonegap的優缺點
- 15. BPMN的優缺點?
- 16. READ_COMMITTED_SNAPSHOT的優缺點
- 17. MongoDB的優缺點?
- 18. Three20的優點和缺點
- 19. smartGWT的缺點和優點
- 20. N2CMS的優點和缺點
- 21. SOAP Pooling的優點/缺點
- 22. Axis2優於WCF的優點和缺點
- 23. 嵌入式清單的優缺點
- 24. 使用一個大的包含文件的優點/缺點
- 25. HIVE,JSON格式
- 26. WPF命令vs事件優點/缺點
- 27. 格式優於連接的優點
- 28. wcf配置文件vs代碼配置的優點和缺點
- 29. 優點和缺點文件的PHP,使用包括()
- 30. 什麼是使用大型CSS文件的優點和缺點?