2011-08-05 68 views
1

也許是一個愚蠢的問題,但我通常會從中學到很多東西。 :)處理XML數據的理想數據結構

我的工作是涉及很多與XML,既作爲輸入和作爲輸出,軟件和大量的處理之間產生。

我首先想到的是在內部使用的字典作爲一個內部數據結構,並從那裏,我的工作方式與讀寫它的過程。

你們想什麼?任何更好的方法,蟒蛇明智?

+0

我覺得這是一個googleable的事情,但什麼類型的東西,你在使用XML做刨?它需要快速嗎?你是生成它還是隻讀它?等等 – Nix

回答

4

的在一般的XML文檔是很多花俏(屬性與子節點,與子節點,實體,XML的聲明,註釋,多文本的混合)的樹。處理應該留給現有的成熟庫 - 對於Python,通常認爲lxml是最方便的選擇,其次是stdlib ElementTree模塊(其中一個lxml模塊lxml.etree受到如此多的啓發以至於incompabilities都是例外)。

這些處理所有的複雜性,並與許多方便的方法(LXML的XPath支持爲我節省了大量的代碼),將其暴露在一定程度上handable方式。解析之後,程序可以 - 繼續將樹轉換爲更簡單的數據結構,該數據結構適合實際建模的數據好得多。 什麼數據結構恰好是可能的和合理取決於你要代表(如果你誤用XML作爲平鍵 - 值存儲,例如,你確實可以去到樹轉換成字典)是什麼。

0

這完全取決於你的XML數據的類型,你需要用它做,你需要從中產生什麼樣的輸出什麼樣的處理等