如果在任何配置單元表上運行DESCRIBE EXTENDED命令,結果會在輸出結尾處顯示totalSize和rawDataSize值。以下字段的含義:'totalSize'和'rawDataSize'是否在hive中的DESCRIBE EXTENDED查詢輸出中表示?
這些字段是什麼意思?
例:
hive > DESCRIBE EXTENDED <TableName>
Output Results:
Table(tableName:TablenameXXXXX, dbName:XXxXXX,
.......... .......................
numRows=116429472, totalSize=3835205544, rawDataSize=35040221600})
totalSize僅反映已使用數據部分的使用空間,還是包含已使用數據部分和HDFS塊的任何未使用部分? –
totalSize是HDFS塊大小的倍數嗎? –
它不一定是塊大小的倍數。 HDFS不會浪費存儲在文件的最後一個塊上。如果文件大小爲200 MB並且塊大小爲128 MB,則第一個塊的大小爲128 MB,第二個塊的大小爲72 MB –