我通過一個包含幾百條記錄的ISI文件解析,這些記錄全部以'PT J
'標記開頭,並以'ER
'標記結尾。我試圖從嵌套循環中的每個記錄拉標籤的信息,但不斷得到一個IndexError。我知道爲什麼我會得到它,但是沒有人比檢查前幾個字符有更好的方式來識別新記錄的開始?Python文件解析 - > IndexError
while file:
while line[1] + line[2] + line[3] + line[4] != 'PT J':
...
Search through and record data from tags
...
我使用同樣的方法,因此偶爾會得到同樣的問題,識別標籤,因此,如果您有任何建議,以及我將不勝感激!
樣本數據,你會發現並不總是包含每個記錄每一個標籤,是:
PT J
AF Bob Smith
TI Python For Dummies
DT July 4, 2012
ER
PT J
TI Django for Dummies
DT 4/14/2012
ER
PT J
AF Jim Brown
TI StackOverflow
ER
我想指出,我在將它轉換爲.txt之前,以及在閱讀之前。 – MTP 2012-07-06 02:47:56