2014-04-21 43 views

回答

1

當你有很大量列的表,你會經常使用特定的列,RC文件格式將是一個不錯的選擇。而不是讀取整行數據,您只需檢索所需的列,從而節省時間。數據被分成若干組,然後分成若干組。

分隔文本文件是一般文件格式。

1

我看到有一對夫婦的答案的讀操作,但因爲你的問題沒有問任何特定的文件格式,答案涉及一個或其他文件格式。

有很多可以在Hive中使用的文件格式。值得注意的是AVRO,Parquet。 RCFile & ORC。如果您想比較這些文件格式的性能和空間利用率,可以在線提供一些很好的文檔。遵循一些有用的鏈接,將讓你走。

This Blog Post

This link from MapR [They don't discuss Parquet though]

This link from Inquidia

上面給出的鏈接將讓你去。我希望這回答您的查詢。

謝謝!