2016-03-03 76 views
-1

我想從CSV加載數據,並將它們準備爲Java類中Apache Spark的多類分類或迴歸MLlib算法。現在我的CSV有3列:如何將字符串從csv轉換爲Apache Spark MLlib

id,main_user,users 
1,bob,"bob,charlie,lee,john" 
1,grorge,"george,charlie,smith" 
2,harvey,"harvey,marley,bob" 
2,smith,"smith,name1,name2" 
3,william,"william,charlie,george" 
3,.....etc... 

如何最好地轉換字符串?第1列和第2列。 我將不勝感激任何示例。

+0

https://github.com/databricks/spark-csv –

+0

我需要字符串tansformation,在Java中。 – Sparkan

+0

你試過了什麼? –

回答

相關問題