-1
我正在使用flume將twitter數據下載到hdfs中。雖然我有超過2 GB的數據,但我的塊文件拆分小於64MB。 即第一個文件有300KB,第二個文件 - 566 KB。 這是爲什麼發生?即使文件大小不是64MB,爲什麼塊文件會被分割?
我正在使用flume將twitter數據下載到hdfs中。雖然我有超過2 GB的數據,但我的塊文件拆分小於64MB。 即第一個文件有300KB,第二個文件 - 566 KB。 這是爲什麼發生?即使文件大小不是64MB,爲什麼塊文件會被分割?
這是因爲你的水槽配置。
閱讀this,你必須設置hdfs.rollInterval或hdfs.rollSize