0
的包我有一個名爲文章我怎麼火花數據幀轉換爲RDD並獲得話
+--------------------+
| processed_title|
+--------------------+
|[new, relictual, ...|
|[once, upon,a,time..|
+--------------------+
我要弄平得到它作爲文字包數據幀。 如何使用當前情況來實現這一點。我試過下面的代碼似乎給我一個類型不匹配的問題。
val bow_corpus = article.select("processed_title").rdd.flatMap(y => y)
我最終想用這個bow_corpus來訓練word2vec模型。
由於