2
因此,問題在於,對於真正大型的表格,配置單元需要花費大量的時間才能顯示錶格的一些行。因此,例如,直接通過數據文件查看配置單元的內容
select * from table limit 1000;
對於十億記錄表可能需要20分鐘。我認爲只需查看錶格的數據文件配置單元存儲可能會快很多。我可以這樣做 -
hadoop fs -cat hdfs://ipAddr/mnt/hive/<path to one of the table files> | head
問題是,行顯示爲一個大的行,沒有明顯的分隔符。因此很難說明一列何時結束而另一列開始。現在,這些文件中必須有一個分隔符來區分列,只是由於某種原因,貓無法看到它。有沒有辦法用某種可見的分隔符來查看數據行?