2013-11-25 43 views
2

因此,問題在於,對於真正大型的表格,配置單元需要花費大量的時間才能顯示錶格的一些行。因此,例如,直接通過數據文件查看配置單元的內容

select * from table limit 1000; 

對於十億記錄表可能需要20分鐘。我認爲只需查看錶格的數據文件配置單元存儲可能會快很多。我可以這樣做 -

hadoop fs -cat hdfs://ipAddr/mnt/hive/<path to one of the table files> | head 

問題是,行顯示爲一個大的行,沒有明顯的分隔符。因此很難說明一列何時結束而另一列開始。現在,這些文件中必須有一個分隔符來區分列,只是由於某種原因,貓無法看到它。有沒有辦法用某種可見的分隔符來查看數據行?

回答

2

默認情況下,蜂巢使用CTRL-A作爲分隔符(字符1),所以我建議你用標籤,或逗號,或任何替換它:

hadoop fs -cat hdfs://ipAddr/mnt/hive/<path> | tr '\001' '\t' | head