我想使用Python將普通結構化文本文件轉換爲CSV格式。Python:將結構化文本解析爲CSV格式
輸入看起來像這樣
[-------- 1 -------]
Version: 2
Stream: 5
Account: A
[...]
[------- 2 --------]
Version: 3
Stream: 6
Account: B
[...]
輸出應該是這個樣子:
Version; Stream; Account; [...]
2; 5; A; [...]
3; 6; B; [...]
即輸入是由[----<sequence number>----]
劃分的結構化文本記錄,其中包含<key>: <values>
-對,輸出應該是CSV,每行包含一條記錄。
我能夠通過
colonseperated = re.compile(' *(.+) *: *(.+) *')
fixedfields = re.compile('(\d{3} \w{7}) +(.*)')
以檢索的<key>: <values>
-pairs成CSV格式 - 但我的結構化文本記錄故障識別開始和結束與重新書寫爲CSV線 - 記錄。此外,我希望能夠分離不同類型的記錄,即區分 - 例如 - Version: 2
和Version: 3
記錄類型。
您輸入的文件不是* CSV格式;它是結構化的,但不是分隔符分隔的。您的輸出*是*。 –
你對不同版本的記錄有何期待? –
不同類型的記錄具有不同數量的元素。 –