使用Spark 2.1(在Databricks上),我有一個表格,它有一個類型爲String的列作爲從.CSV文件導入的結果。在針對該表的SELECT查詢中,我試圖在數學運算中使用列值之前將該列的值轉換爲Integer。我一直無法找到正確的Spark SQL「函數」來執行此操作。如何將字符串值轉換(或轉換)爲整數值?
下面是一個SQL的例子。 「TO_NUMBER」對兩個字符串中的任何一個都不起作用; Sum_GN_POP或Count1:
SELECT name AS geohashPrefix3, TO_NUMBER(Sum_GN_POP) AS totalPopulation, TO_NUMBER(Count1) AS landMass
FROM wayne_geohash3
WHERE (LENGTH(name) = 3)
如果我能找到相關文檔,這將會有所幫助。我也想用其他類型進行其他類型的轉換(或轉換)。任何一方或雙方的任何指導都將不勝感激。
我會建議使用udf來解析.... –