我的元組函數來計算多個運行總計
(something1, 500)
(something1, 200)
(something1, 300)
(something2, 200)
(something2, 600)
(something2, 400)
我寫了一個函數pySpark做計算得到的結果是這樣的列表。功能基本上需要總結的總髮生
(something1, 1000),
(something2, 1200)
我的功能至今
def add_function(key, value):
last_key = None
recur_total = 0
key, value = join_data[0][0], join_data[0][1]
if last_key == key:
recur_total+ = value
else:
if last_key:
recur_total = value
if last_key == key:
recur_total = value
last_key = key
if last_key == key:
return(last_key, value)
問題計數的我面對
- 我無法給函數粘貼爲pySpark控制檯的一個功能。它被分成多個提示。
- 它說第6行的語法錯誤(recur_total + = value)。
我在做什麼錯,以及如何糾正?
簡單地做只要您的縮進是正確的,「多個提示」確實可以正確創建單個函數 –
仔細檢查提供語法錯誤的行上的間距 –
最後一條if語句看起來向內間隔太多。 – synchronizer