我是新手,我需要此問題的幫助。拆分字段並從一行創建多行Spark-Scala
我有一個CSV文件是這樣的:
ANI,2974483123 29744423747 293744450542,Twitter,@ani
我需要拆分第二列 「2974483123 29744423747 293744450542」,並創建3行是這樣的:
ANI,2974483123,Twitter,@ani
ANI,29744423747,Twitter,@ani
ANI,293744450542,Twitter,@ani
有人能幫助我嗎?請!
只專注於三個國家:美國,加拿大,MX .....原始記錄: [ 「MotelID」, 「BidDate」, 「胡」, 「英國」, 「NL」, 「美」 ,MX,AU,CA,CN,KR,BE,I,JP,IN,HN,GY, [0000002,11-05-08-2016,0.92,1.68,0.81,0.68,1.59,1.63,1.77,2.06,0.66,1.53,0.32,0.88,0.83,1.01] 只保留三個重要的 0000002 ,11-05-08-2016,1.59,,1.77 轉置記錄並將相關Losa包含在單獨的列中 0000002,11-05-08-2016,US,1.59 0000002,11-05-08-2016 ,MX, 0000002,11-05-08-2016,CA,1.77 ....如何獲得以上結果? – user3252097