如何使用Spark scala遍歷下面的RDD。我想要打印Seq中與關聯密鑰相關的每個值 res1: org.apache.spark.rdd.RDD[(java.lang.String, Seq[java.lang.String])] = MapPartitionsRDD[6] at groupByKey at <console>:14
我試過下面的代碼。 val ss=mapfile.ma
所以我對函數式編程以及Spark和Scala相當新穎,所以如果這很明顯,請原諒我......但基本上我有一個HDFS文件列表,一定的標準,即是這樣的: val List = (
"hdfs:///hive/some.db/BigAssHiveTable/partyear=2014/partmonth=06/partday=01/000140_0",
"hdfs:///hive/some.db/B