我的問題是:正則表達式從混亂的字符清潔CSV
我使用的一些軟件就出來了一個csv,而問題是,這個軟件是不是處理CSV如此出色的原因有一些字符串在他們中引用的csv以及包裝字符串的內容也被引用,因此我會解析它。
所以這是正常的CSV:
"one","two","three"
,這裏是我的情況:
"one","tw"o","three"
所以我有問題解析字符串像"tw"o"
。這基本上是輸出文件的軟件的問題,我無法編輯該軟件。
所以我想我可以創建一個正則表達式,將採取不必要的引號或逗號,並確保每個字符串都包在引號中並用逗號分隔,有人知道我該如何實現它?
即時通訊使用的tototoshi庫斯卡拉
是否有一個特定的原因,您爲什麼不使用Python的'csv'包來處理'.csv'文件? –
@WillemVanOnsem即時通訊使用tototoshi for scala,但這些庫不能解析它,因爲它不是一個正確的格式...如果它是「一個」,「兩個」,「三個」沒有問題,但它的「一個」,「tw」 o「,」three「,所以圖書館不能解析它 – JohnBigs
爲什麼總是看正則表達式?即使你找到了這個東西,我*認爲*看起來可能非常可怕。哎喲:你需要**其他**人甚至想一想,對於你來說,保持**這個正則表達式有多容易?意思是:有時候應該考慮坐下來寫他自己的解析器,並明確地做事;而不是拋出怪物的正則表達式。 – GhostCat