0
我的問題是,我有一個500k行的Oracle表。我設置了sqoop將它作爲parquet文件導入HDFS。我將--num-partition參數設置爲32,我得到了32個parquet文件,但其中一個是28 MB大小,其他大小僅爲2-3 KB。sqoop進口拼花地板尺寸
這裏是我的sqoop命令:
bin/sqoop import --connect <JDBC> --username <USER> --password <PASSWD> --table <TABLE> --target-dir <TARGET_DIR> -m32 --as-parquetfile --delete-target-dir --outdir <DIR>
我的問題是,什麼可能是這個文件大小的原因嗎?