執行平均操作我有這樣如何在Apache中弗林克使用Scala的
15,Rom,36,49
16,Weyoun,22,323
17,Odo,35,13
18,Jean-Luc,45,455
的數據集,我想選擇第3列和第4列作爲我的鍵和值,我怎麼能執行Apache的平均操作弗林克。我能夠實現「按鍵分組」。但我無法對每個鍵的值執行平均操作。
val lines: DataSet[String] = env.readTextFile("/home/kiran/Desktop/social_friends.csv")
val jn = lines.map(line => line.split(",")).map(word => (word(2).toString,word(3).toInt)).groupBy("0")
Flink中沒有平均運營商。您需要使用「減少」或「聚集」並編寫自定義UDF代碼。 –
我知道。你能告訴我如何使用reduce或aggregate函數來執行它。 –