2017-03-17 106 views

回答

6

您可以使用monotonically_increasing_id

import org.apache.spark.sql.functions._ 
val unique_df = original_df.withColumn("UniqueID", monotonically_increasing_id) 
+0

我試圖像上面那樣運行它。但我得到:沒有模塊命名monotonically_increasing_id – user3245256

+0

它應該工作。你有沒有使用該導入聲明?你的火花版本又是什麼? – Tawkir

+0

謝謝。我得到它的工作。這個特別的進口聲明對我不起作用。我必須將其更改爲:從pyspark.sql.functions import monotonically_increasing_id – user3245256

相關問題