我想改變第一個DStream成爲第二個使用spark。但我不知道該怎麼做?我已經嘗試了groupByKey(),它沒有工作,aggregateByKey()只使用RDD而不是DStream。如何使用相同的密鑰組合一個DStream密鑰和值對?
這是當前結果:
DStream [(1,value1),(2,value2),(3,value3),(1,value4),(1,value5),(2,value6)]
這是結果,我想:
DStream(1,(value1,value4,value5)) ,(2,(value2,value5)) ,(3,(value3))
感謝您的答覆。
你是什麼意思'groupByKey' _didn't work_? – zero323
使用與groupByKey相同的鍵在組合它們時不會給我相同的鍵和值對。這意味着它不會給我這個結果:DStream(1,(value1,value4,value5)),(2,(value2,value5)),(3,(value3))。我不知道如何做到這一點,也許我使用groupByKey錯誤? – peter