0
選項是否DataFrameReadercsv(路徑:字符串)跳過空白行
org.apache.spark.sqlDataFrameReadercsv(path: String)
有跳過空白行的選項?特別是,最後一行是空行嗎?
選項是否DataFrameReadercsv(路徑:字符串)跳過空白行
org.apache.spark.sqlDataFrameReadercsv(path: String)
有跳過空白行的選項?特別是,最後一行是空行嗎?
你可以嘗試設置mode
到"DROPMALFORMED"
爲:
val df = sqlContext.read.format("com.databricks.spark.csv").option("mode", "DROPMALFORMED")...
在Python
:
df = sqlContext.read.format('com.databricks.spark.csv').options(mode = "DROPMALFORMED")...
其中根據documentation:
"...drops lines which have fewer or more tokens than expected."
現在我得到這個錯誤: va lue選項不是org.apache.spark.sql.DataFrame的成員 –
我認爲上面使用了Python語法。對於Scala,請使用spark.read.option(「mode」,「DROPMALFORMED」)。csv(path) –