我想爲DataSet中的Row類型編寫一個編碼器,用於我正在執行的映射操作。本質上,我不懂如何編寫編碼器。 下面是一個地圖操作的示例: In the example below, instead of returning Dataset<String>, I would like to return Dataset<Row> Dataset<String> output = dataset1.fl
嘗試,因爲我可能,我不能創建具有足夠的精度來處理DecimalType(38,0)的情況下類的數據集。 我已經試過: case class BigId(id: scala.math.BigInt)
這遇到錯誤的ExpressionEncoderhttps://issues.apache.org/jira/browse/SPARK-20341 我已經試過: case class BigId(id
我嘗試在Spark SQL中重新創建SQL查詢。通常我會插入這樣一個表: INSERT INTO Table_B
(
primary_key,
value_1,
value_2
)
SELECT DISTINCT
primary_key,
value_1,
value_2
FROM
Table_A
WHERE NOT