我有一個DataFrame,DataFrame hava兩列'value'和'timestamp','timestmp'是有序的,我想得到DataFrame的最後一行,我該怎麼辦?如何從DataFrame獲取最後一行?
這是我輸入:
+-----+---------+
|value|timestamp|
+-----+---------+
| 1| 1|
| 4| 2|
| 3| 3|
| 2| 4|
| 5| 5|
| 7| 6|
| 3| 7|
| 5| 8|
| 4| 9|
| 18| 10|
+-----+---------+
這是我的代碼:
val arr = Array((1,1),(4,2),(3,3),(2,4),(5,5),(7,6),(3,7),(5,8),(4,9),(18,10))
var df=m_sparkCtx.parallelize(arr).toDF("value","timestamp")
這是我預期的結果:
+-----+---------+
|value|timestamp|
+-----+---------+
| 18| 10|
+-----+---------+
請問'df.where($ 「時間戳」 === MAX($ 「時間戳」)'工作? –
它亙古不變的工作交流rangepartitioning(TS# 7 ASC NULLS FIRST,200) – mentongwu