2012-10-15 65 views
0

我遇到一個「XML」片段,看起來像這樣(縮進和縮寫 - 在...代表進一步標籤):解析「XML」與編號項

<items>"Std Stability" 
    <items[1]> 
    <id>-2</id> 
    ... 
    </items[1]> 
    <items[2]> 
    <id>-5</id> 
    </items[2]> 
    ... 
</items> 

[1]數字嗆解析器我正在使用(lxml)。有一些類似的格式,這些格式是有效的嗎?或者我將不得不編寫一個自定義分析器來處理它?

我對格式沒有任何控制權,並且文檔實際上沒有描述或命名格式。

回答

2

這不是一個有效的Xml文檔,您將無法使用任何符合XML的解析器處理它。我之前沒有看到過這樣的格式,所以我不知道用什麼工具來處理這個。我假設他們有一個「自制的」Xml-ish解析器,你可能想用它來讀取它。從Xml的角度來看 - 在這種情況下,您總是希望將輸入固定在源代碼中。開始修正這樣的問題,使其成爲有效的XML通常會導致問題。

+0

謝謝。我已經使用pyparsing實現了一個最小化的解析器,它現在正在完成這項工作。 –