我是新來的scala和火花,我試圖將一個Tab分解文件轉換爲CSV文件,以進一步將其轉換爲RDD。 其實我試圖使用sc.textFile
將Tab分隔文件轉換爲RDD。它正在實施,但之後的結果如.first()
,.take(n)
不是很系統,即使在使用foreach(println)
後也無法正確讀取。 我試圖使用Excel將文件轉換爲csv,但數據大小非常大,它並沒有在第一個地方加載。 是否有任何簡單的ay 將Tab分隔文件轉換爲CSV以便獲得上述問題的系統結果。轉換製表符分隔文件爲csv文件
1
A
回答
0
這裏是一個小教程:
比方說,你TSV的數據是: row11 \t row12 \t row13... \t row1n row21 \t row22 \t row23... \t row2n
閱讀本文件作爲字符串RDD:
val readFile = sc.textFile("FILEPAHT HERE")
解析它的內容通過使用標籤分隔符:
val parseRows = readFile.map(row => row.split("\t"))
轉換行陣列成分隔的字符串 「」
val outputCsvRdd = parseRows.map(row => row.mkString(","))
寫出這將是一個CSV文件:
相關問題
- 1. 如何將製表符分隔文件轉換爲CSV文件
- 2. 將文件(csv,excel,製表符分隔)轉換爲XML
- 3. 無法將製表符分隔的.txt文件轉換爲csv
- 4. 如何製表符分隔的文本文件轉換爲csv文件在Python
- 5. 轉換製表符分隔的文件轉換成CSV文件在C#
- 6. 轉換文件,CSV的分隔符fomat
- 7. 製表符分隔文本文件轉換爲XML(Javascript或PHP)?
- 8. 將製表符分隔的文本文件轉換爲JSON
- 9. 使用OpenOffice Calc打開Excel文件並轉換爲CSV或製表符分隔
- 10. 如何將製表符分隔的文件轉換爲CSV格式?
- 11. 將數據集轉換爲文本文件製表符分隔文件
- 12. 將Excel文件批量轉換爲製表符分隔的文本文件
- 13. 如何XLSX轉換爲製表符分隔的文件
- 14. 將製表符分隔文件批量轉換爲xls
- 15. PHP將逗號分隔的字符串轉換爲CSV文件
- 16. 將字符串字段轉換爲分隔文件(.csv)
- 17. 將xls文件轉換爲製表符分隔文件的異常
- 18. 將多個dta文件轉換爲Stata中的製表符分隔文件
- 19. 需要腳本來將逗號分隔文件轉換爲製表符分隔
- 20. 使用換行符作爲分隔符將文件轉換爲CSV
- 21. CSV文件分隔
- 22. 修改用於將XML轉換爲製表符分隔文本文件的XSLT
- 23. 將純文本文件轉換爲以管道分隔的CSV文件
- 24. 繪製分隔符爲';'的CSV文件。 '(分號+空格)
- 25. 將.txt文件連接到帶有製表符分隔符的csv文件
- 26. 將.csv轉換/分析爲xlsx文件
- 27. 將.csv文件轉換爲.xls文件
- 28. 將.xls文件轉換爲.csv文件?
- 29. Summary.glm轉換爲CSV文件?
- 30. 使用String.split()將文本分隔符分割爲csv文件
http://carminedimascio.com/2015/ 02/apache-spark-convert-csv-to-rdd /也許你可以提供你到目前爲止已經嘗試過的和你的csv樣本? – sascha10000
看看這個答案:http://stackoverflow.com/a/33898041 – mfirry