2015-07-22 58 views
0

我創建了一個數據幀sparkR,人們如何選擇sparkR數據幀的列值?

+----+-------+ 
| age| name| 
+----+-------+ 
|20.0|Michael| 
|30.0| Andy| 
|19.0| Justin| 
+----+-------+ 

我怎麼能選擇列「時代」的第一個值。在R語言中,我們可以通過people$age[1]來完成,結果爲20.0。我們如何在sparkR Data框架中做同樣的事情。

TIA, 阿倫

回答

2

在SparkR你有函數首先,它僅適用於DataFrames,而不是列。因此你可以做

first(people)$age 

這隻適用於第一項。一個SparkR數據框中沒有排索引,你可以使用,無論頭部或採取決定你想要多少個項目獲得:

head(people, 5)$age 
take(people, 5)$age 

但是沒有辦法只能拿第五元素。

相關問題