後的代碼插入新列我怎麼可以處理數據,並使用數據框
val df = spark.sql(sql_query)
df.show()
我得到一個架構
// +--------+-------+
// | id_card| year|
// +--------+-------+
// |001_1976| 2017 |
// |015_1983| 2012 |
// |078_1963| 2011 |
// +--------+-------+
那麼我想"work_year"
(year - id_card.substring(4,8))
我有一個名爲新列閱讀源代碼有關withColumn()
我注意到的withColumn
列PARAM必須org.apache.spark.sqlColumn
,而不是簡單的字符串,它確實讓我感到不安。
spark version: Spark 2.1.0
scala version: 2.12.1
jdk version: 1.8
謝謝!我會嘗試。 – Pulga
關於Java版本是什麼嗎? – Pulga
java版本應該是不相關的。但我會建議ATLEAST的Java 7+ –