經過大量程序化清理後,我的數據集看起來像這樣(顯示部分數據集在此處)。刪除Spark中RDD行中的連續空格
ABCD A [email protected] 79
BGDA F [email protected] 89
我想這轉換成以下進一步星火據幀操作
ABCD,A,[email protected],79
BGDA,F,[email protected],89
val reg = """/\s{2,}/"""
val cleanedRDD2 = cleanedRDD1.filter(x=> !reg.pattern.matcher(x).matches())
但這沒有返回。我如何找到並用分隔符替換空字符串? 謝謝! rt
拆下正則表達式的分隔符:'VAL REG = 「」 「\ s {2}」 「」'你不能用'。匹配()',因爲它需要完整的字符串匹配。使用'find()'。 –
也許,你想要的更簡單,就像https://ideone.com/T8OSIC。 –
謝謝Wiktor。這有幫助! – user1384205