-1
我想從CSV加載數據,並將它們準備爲Java類中Apache Spark的多類分類或迴歸MLlib算法。現在我的CSV有3列:如何將字符串從csv轉換爲Apache Spark MLlib
id,main_user,users
1,bob,"bob,charlie,lee,john"
1,grorge,"george,charlie,smith"
2,harvey,"harvey,marley,bob"
2,smith,"smith,name1,name2"
3,william,"william,charlie,george"
3,.....etc...
如何最好地轉換字符串?第1列和第2列。 我將不勝感激任何示例。
https://github.com/databricks/spark-csv –
我需要字符串tansformation,在Java中。 – Sparkan
你試過了什麼? –