2014-06-30 157 views
-1

我是新來的編程在Python中,我一直在解析XML文件。解析XML文件時編輯文本

我已經使用了XML解析器,我能夠解析文件。

import xml.etree.ElementTree as ET 
tree = ET.parse('hi.xml') 

root = tree.getroot() 
count = 0 
for changetexts in root.findall('log'): 
    temp = changetexts.text 

的changetexts.text返回日誌標籤,它實際上是日期和修改時間和含有什麼已被修改的註釋下的全部內容。

但現在的問題出現了:我需要文件日誌的前10行。但我實際上檢索了日誌文件的所有內容(比如2000行左右)。

任何人都可以建議我的概念,我應該用來訪問日誌的前10行。 代碼片段也將有所幫助。

注意:日誌標記中沒有標記。

標籤的看法是這樣的:

<log> 
date_1   time_1    comment_1 
date_2   time_2    comment_2 
date_3   time_3    comment_3 

</log> 
+0

你是什麼意思 「十強」?你的意思是_first十行,還是其他一些標準? –

+0

其實它的前10行。對不起,我沒有明確指定它 – sankar

回答

1

使用splitlines()

import xml.etree.ElementTree as ET 
tree = ET.parse('hi.xml') 

root = tree.getroot() 
count = 0 
for changetexts in root.findall('log'): 
    temp = changetexts.text 
    lines = temp.splitlines() 
    tenlines = lines[0:10] 
    print (len(tenlines)) # Should be 10, use tenlines variable as you wish !! 
+0

謝謝你的作品 – sankar