0
假設我有一個數字列Age的數據框。如何在pyspark進行年齡綁定?
我想年齡以基於值的新列
事情是這樣的:
Age | New Age Range
-----------------------------------
4 | 0-18
25 | 19-65
90 | 65+
.... | ....
我想用一個函數的...
def AgeByRange(Age):
for i in Age:
if i < 19:
return '0-18'
elif ......
卜我懷疑有更好的方法來做到這一點。
改變了加入略微但這種偉大的工作:) –