elementtree

11熱度

3回答

我想添加doctype到我用LXML的etree生成的XML文檔中。但是我不知道如何添加文檔類型。對字符串進行硬編碼和拼接不是一種選擇。我期待沿如何PI在etree加線的東西： pi = etree.PI(...) doc.addprevious(pi) 但它不是爲我工作。如何使用lxml添加到xml文檔？

64熱度

4回答

XML解析 - ElementTree的VS SAX和DOM

Python有幾種方法來解析XML ... 我明白與SAX解析的非常基本的。它用作流解析器，具有事件驅動的API。我明白了DOM解析器也。它將XML讀入內存並將其轉換爲可以用Python訪問的對象。一般來說，很容易根據你需要做的，內存限制，性能等什麼2之間選擇（希望我是正確爲止）。既然Python 2.5，我們也有ElementTree。這與DOM和SAX相比如何？哪一個更類似於？爲什麼它

2熱度

1回答

使用ElementTree/lxml查找文本字符串的父標記

我試圖從文本中提取一段文本，並從HTML中「提取」段落/文檔中的其餘文本。我目前的做法是試圖找到已經用lxml解析過的html中字符串的「父標籤」。（如果您知道解決此問題的更好方法，那麼我就是耳朵！）例如，在樹中搜索「TEXT STRING HERE」並返回「p」標記。（注意，我不會知道html的確切佈局） <html> <head> ... </head> <body> ...

5熱度

2回答

如何用Python的ElementTree創建「虛擬根」？

我想用Python的ElementTree生成一個XHTML文件。然而，ElementTree.Element（）只是讓我創建一個標籤（例如HTML）。我需要創建某種虛擬根或其他名稱，以便我可以放置各種DOCTYPES等。我該怎麼做？感謝

6熱度

6回答

如何使用ElementTree獲取元素的完整XML或HTML內容？

也就是說，所有的文本和子標籤，沒有標籤本身的元素？有 blah bleh blih 我想 blah bleh blih element.text返回「嗒嗒」和etree.tostring（元素）返回： blah bleh blih

4熱度

4回答

使用ElementTree的節點內部的HTML

我正在使用ElementTree來解析XML文件。在某些領域，會有HTML數據。例如，考慮如下聲明： <Course> <Description>Line 1 Line 2</Description> </Course> 現在，假設_course是一個元素變量，它包含這個Couse元素。我想訪問本課程的描述，所以我這麼做： desc = _course.find("Des

3熱度

2回答

Python 2.5是否包含一個用於本地轉換XML文檔的包？

在我的Python應用程序中，我有一個XML文檔，我想使用我的XSL文件進行轉換。我目前使用xml.etree來生成XML文檔，但是我還沒有在Python 2.5中找到任何能夠讓我本地轉換我的XML文檔的東西。我已經找到了一個可以執行轉換的庫（libxslt），但我認爲Python會有一個本地庫來達到預期的效果。有什麼想法？

9熱度

4回答

ElementTree替代XML解析器來緩解UTF-8的災難？

我用elementtree.parse（）函數解析了一些XML。它的工作原理除了一些utf-8字符（128字節以上的單字節字符）。我看到默認的解析器是基於expat的XMLTreeBuilder。有沒有我可以使用，可能不太嚴格，並允許UTF-8字符替代分析器？這是我與默認解析器得到的錯誤： ExpatError: not well-formed (invalid token): line 31