2017-09-13 40 views
0

這是我的data:RDD[Array[String]]火花。我想統計數據中所有元素長度的總和。例如data:(Array(1,2),Array(1,2,3))。我想得到總和:2 + 3 = 5; 起初,我用:data.flatMap(_).count()火花使用下劃線作爲參數RDD.flatmap或地圖

錯誤:

error: missing parameter type for expanded function ((x$1) => data.flatMap(x$1))

但是,當我更換_x=>x寫:data.flatMap(x=>x).count(),它的工作原理。所以我很困惑_。我認爲在斯卡拉_可以稱爲實際的參數類型,對吧?

回答

-2

請參閱問題here

本質上,_本身沒有定義函數。在匿名函數語法中使用時,它可以用作變量名的佔位符,但當它本身被使用時,它就沒有任何意義。