0
我有型Seq[Seq[(Double, Double)]]
的變量:如何使用期望RDD [(Double,Double)]作爲Seq [Seq [(Double,Double)]]的輸入的函數?
val output: Seq[Seq[(Double, Double)]] = runStreams(ssc, numBatches, numBatches)
現在我想申請功能RegressionMetrics
這需要RDD[(Double, Double)]
作爲輸入:
val metrics = new RegressionMetrics(output)
如何變換Seq[Seq[(Double, Double)]]
到RDD [(雙人間, Double)]`爲了能夠使用類RegressionMetrics的函數?
好的,謝謝。我正在使用Seq進行測試。那麼,我是否理解正確,如果使用磁盤上存儲的一些數據,我可以將它讀入RDD並替換Seq? – Klue
正確!對於測試 - 首先,您可以使用Spark的本地模式輕鬆創建獨立的SparkContext;其次,實際上你可以按照這裏所建議的使用'parallelize',或者直接通過'SparkContext.textFile'從文件中加載數據 –