elementtree

    11熱度

    3回答

    我想添加doctype到我用LXML的etree生成的XML文檔中。 但是我不知道如何添加文檔類型。對字符串進行硬編碼和拼接不是一種選擇。 我期待沿如何PI在etree加線的東西: pi = etree.PI(...) doc.addprevious(pi) 但它不是爲我工作。如何使用lxml添加到xml文檔?

    64熱度

    4回答

    Python有幾種方法來解析XML ... 我明白與SAX解析的非常基本的。它用作流解析器,具有事件驅動的API。 我明白了DOM解析器也。它將XML讀入內存並將其轉換爲可以用Python訪問的對象。 一般來說,很容易根據你需要做的,內存限制,性能等 什麼2之間選擇(希望我是正確爲止)。 既然Python 2.5,我們也有ElementTree。這與DOM和SAX相比如何?哪一個更類似於?爲什麼它

    2熱度

    1回答

    我試圖從文本中提取一段文本,並從HTML中「提取」段落/文檔中的其餘文本。 我目前的做法是試圖找到已經用lxml解析過的html中字符串的「父標籤」。 (如果您知道解決此問題的更好方法,那麼我就是耳朵!) 例如,在樹中搜索「TEXT STRING HERE」並返回「p」標記。 (注意,我不會知道html的確切佈局) <html> <head> ... </head> <body> ...

    5熱度

    2回答

    我想用Python的ElementTree生成一個XHTML文件。 然而,ElementTree.Element()只是讓我創建一個標籤(例如HTML)。 我需要創建某種虛擬根或其他名稱,以便我可以放置各種DOCTYPES等。 我該怎麼做? 感謝

    6熱度

    6回答

    也就是說,所有的文本和子標籤,沒有標籤本身的元素? 有 <p>blah <b>bleh</b> blih</p> 我想 blah <b>bleh</b> blih element.text返回 「嗒嗒」 和etree.tostring(元素)返回: <p>blah <b>bleh</b> blih</p>

    4熱度

    4回答

    我正在使用ElementTree來解析XML文件。在某些領域,會有HTML數據。例如,考慮如下聲明: <Course> <Description>Line 1<br />Line 2</Description> </Course> 現在,假設_course是一個元素變量,它包含這個Couse元素。我想訪問本課程的描述,所以我這麼做: desc = _course.find("Des

    3熱度

    2回答

    在我的Python應用程序中,我有一個XML文檔,我想使用我的XSL文件進行轉換。我目前使用xml.etree來生成XML文檔,但是我還沒有在Python 2.5中找到任何能夠讓我本地轉換我的XML文檔的東西。 我已經找到了一個可以執行轉換的庫(libxslt),但我認爲Python會有一個本地庫來達到預期的效果。 有什麼想法?

    9熱度

    4回答

    我用elementtree.parse()函數解析了一些XML。它的工作原理除了一些utf-8字符(128字節以上的單字節字符)。我看到默認的解析器是基於expat的XMLTreeBuilder。 有沒有我可以使用,可能不太嚴格,並允許UTF-8字符替代分析器? 這是我與默認解析器得到的錯誤: ExpatError: not well-formed (invalid token): line 31