包含點的pyspark數據幀(例如「id.orig_h」)將不允許groupby
uppon,除非首先被withColumnRenamed
重命名。有沒有解決方法? "`a.b`"
似乎沒有解決它。pyspark數據框的訪問列帶點「。」
1
A
回答
4
在我pyspark殼,下面的代碼片段正在努力:
from pyspark.sql.functions import *
myCol = col("`id.orig_h`")
result = df.groupBy(myCol).agg(...)
和
myCol = df["`id.orig_h`"]
result = df.groupBy(myCol).agg(...)
我希望它能幫助。
+0
謝謝@Daniel de Paula的回答。你能確認使用''groupby(「'id.orig_h'」)''不起作用嗎? –
+0
@HananShteingart,對於我來說,下面的代碼有效:'df.groupBy(「\'id.orig_h \'」)。agg(...)' –
+0
對我來說它並不是。你可以請添加更多的列從ID開始。 ?我使用pyspark 1.6 –
相關問題
- 1. PySpark訪問計數列
- 2. PySpark數據框:點到點的逗號
- 3. pyspark數據框列名
- 4. 過濾Pyspark數據框列
- 5. Pyspark:從pyspark數據框中
- 6. 訪問數據框中的列名稱
- 7. 訪問列表框中的數據
- 8. Pyspark數據框中SQL
- 9. 彙總數據框中pyspark
- 10. Pyspark:使用數據框
- 11. 從數據框列表中訪問熊貓數據框對象
- 12. 訪問pyspark中的數據幀的計數值
- 13. 如何從pyspark數據框檢索列並將其作爲新列插入到現有pyspark數據框中?
- 14. 數據不被填充數據框 - PySpark
- 15. 如何在pyspark中創建列表的數據框的元組的數據框?
- 16. PySpark:從列值中命名一個新的數據框列
- 17. 替換pyspark數據框中的值
- 18. PySpark將新列添加到數據框與新列表
- 19. Pyspark - 在火花數據框列使用reducebykey即列出
- 20. Pyspark - 排序數據框中列包含列表
- 21. 字符串類型的pyspark數據框列的條形碼
- 22. PySpark數據框:根據條件同時更改兩列
- 23. 如何將帶匹配標點的列加入數據框?
- 24. 在MySql的列名中使用多個點訪問列數據
- 25. 如何訪問列表中的所有數據點中列出
- 26. 鑄造帶有文本列的數據框的問題
- 27. 帶有2行數據的列表框
- 28. 如何更改pyspark中的數據框列名?
- 29. Pyspark替換Spark數據框列中的字符串
- 30. PySpark:爲數據框中的每一行獲取頂部k列
你可以分享你正在使用的代碼組嗎? –