直接通過數據文件查看配置單元的內容

因此，問題在於，對於真正大型的表格，配置單元需要花費大量的時間才能顯示錶格的一些行。因此，例如，直接通過數據文件查看配置單元的內容

select * from table limit 1000;

對於十億記錄表可能需要20分鐘。我認爲只需查看錶格的數據文件配置單元存儲可能會快很多。我可以這樣做 -

hadoop fs -cat hdfs://ipAddr/mnt/hive/<path to one of the table files> | head

問題是，行顯示爲一個大的行，沒有明顯的分隔符。因此很難說明一列何時結束而另一列開始。現在，這些文件中必須有一個分隔符來區分列，只是由於某種原因，貓無法看到它。有沒有辦法用某種可見的分隔符來查看數據行？

默認情況下，蜂巢使用CTRL-A作爲分隔符（字符1），所以我建議你用標籤，或逗號，或任何替換它：

hadoop fs -cat hdfs://ipAddr/mnt/hive/<path> | tr '\001' '\t' | head

2013-11-25 04:15:53

回答