1
我有大約10萬條記錄(以Java的ArrayList存儲)。我想將這些記錄插入Impala。插入Impala表vs寫入HDFS
我應該用insert into table partition values
直接插入黑斑羚。 (我不確定在一個sql語句中可以插入多少條記錄。)
或者我應該將這些記錄寫入HDFS,然後alter impala
表?
哪種方式是首選?還是有其他解決方案嗎?
而且如果我每5分鐘做一次,我怎樣才能避免一個分區中的這麼多小文件(按小時分區)?這些將在每個分區中生成12個小文件,這會影響查詢速度嗎?