我有一個DataFrame,我想與另一個Dataframe連接,然後按原始行進行分組,但原始行沒有唯一的id。我如何添加一個唯一的ID或以其他方式實現該目標。如何添加一個唯一的id列到DataFrame,Apache Spark,Scala
回答
您可以使用monotonically_increasing_id
import org.apache.spark.sql.functions._
val unique_df = original_df.withColumn("UniqueID", monotonically_increasing_id)
我試圖像上面那樣運行它。但我得到:沒有模塊命名monotonically_increasing_id – user3245256
它應該工作。你有沒有使用該導入聲明?你的火花版本又是什麼? – Tawkir
謝謝。我得到它的工作。這個特別的進口聲明對我不起作用。我必須將其更改爲:從pyspark.sql.functions import monotonically_increasing_id – user3245256
- 1. Spark Scala - 將一個記錄和一列的Dataframe轉換爲Double
- 2. 如何將一個唯一的ID添加到onclick事件
- 3. Spark DataFrame將行添加列
- 4. 如何在Spark中打印DataFrame列的唯一值?
- 5. spark scala DataFrame error
- 6. Spark scala Dataframe isin
- 7. 如何在Scala和Apache Spark中連接兩個DataFrame?
- 8. Scala/Spark:使用RDD唯一功能壓扁DataFrame
- 9. Scala - 刪除Spark DataFrame的第一行
- 10. Scala/Apache Spark轉換DataFrame列值和類型,否則爲多個
- 11. HOWTO爲每個唯一行添加一個唯一的ID?
- 12. Scala Dataframe:如何使用兩個Dataframes之間的條件將列添加到Dataframe?
- 13. Spark Scala篩選器DataFrame其中值不在另一個DataFrame中
- 14. Scala Spark,如何爲列添加值
- 15. 在Apache Spark Scala中,如何從CSV中填充DataFrame中的Vectors.dense?
- 16. 如何將Spark Spark Scala DataFrame綁定到zeppelin的sparkR?
- 17. 如何在一個drupal塊中的polldaddy中添加唯一ID?
- 18. 添加一個唯一的ID HAML列表項
- 19. 向Firebase添加唯一ID
- 20. Spark Scala DataFrame中的動態列選擇
- 21. PHP添加第一個表列ID到另一個表列ID
- 22. 在Spark-Scala中,如何將數組列表複製到DataFrame中?
- 23. 添加一個唯一的id到csv輸出
- 24. 將唯一ID添加到表
- 25. 如何添加一個動態/唯一ID haml週期
- 26. 在Spark DataFrame中的na.fill Scala
- 27. Spark列表選擇一個列列Scala
- 28. Scala apache spark cassandra表列表
- 29. 向Spark DataFrame添加嵌套列
- 30. 向Spark DataFrame添加一列併爲其計算值
能否請您與列詳細信息添加兩個樣品dataframes? –