我有一個包含2列的數據幀:timestamp,值 timestamp是自時間以來的時間,值是浮點值。 我想合併行的平均值分鐘。 這意味着我想要獲取時間戳來自同一輪分鐘(自紀元以來60秒的時間間隔)的所有行,並將它們合併到單個行中,其中值列將是所有值的平均值。將火花數據幀中的多行合併到一行中
舉一個例子,讓我們假設我的數據幀看起來像這樣:
timestamp value
--------- -----
1441637160 10.0
1441637170 20.0
1441637180 30.0
1441637210 40.0
1441637220 10.0
1441637230 0.0
第一4行是相同的分的一部分(1441637160%60 == 0,1441637160 + 60 == 1441637220) 最後2行是另一分鐘的一部分。 我想合併相同分鐘的所有行。得到如下結果:
timestamp value
--------- -----
1441637160 25.0 (since (10+20+30+40)/4 = 25)
1441637220 5.0 (since (10+0)/2 = 5)
這樣做的最佳方法是什麼?