我解析了用逗號分隔的Python文件,其中一些文本字段是用引號雙分隔的,因爲文本包含非定界逗號。例如,給定此線路輸入的:用Python解析雙定界文件
field_1,field_2,...,"this,field,contains,non-delimiting,commas",...,field_n
我需要治療"this,field,contains,non-delimiting,commas"
作爲含有討厭的逗號單引號分隔字段。
我的代碼通過比較每行輸入中的所有逗號和引號的索引,並在配對引號之外的所有逗號的索引處對行進行切片來處理此操作。
雖然這讓我覺得非pythonic,我希望能得到一些獲得更多pythonic解決方案的建議。
像field_1這樣的字段可以像整數嗎?例如123,「helloWorld」,99,「ha,ha,ha」 –
@ SamuelToh:是的。字段可以包含任何字符並表示任何數據類型。在這個階段唯一的考慮就是在處理內部分隔符時將字段標記爲文本。 – Schemer
使用csv閱讀器:https://docs.python.org/2/library/csv.html –