lxml

    5熱度

    1回答

    我有一個XML文件,是book.xml(http://msdn.microsoft.com/en-us/library/ms762271(VS.85).aspx) 我想貓的books.xml,並得到所有書籍ID和類型的書ID。 類似 cat books.xml | python reader.py 任何提示或幫助將不勝感激。謝謝。

    5熱度

    1回答

    我在REST風格的Web服務中使用Cherrypy,服務器因此返回XML(使用lxml創建XML)。其中一些XML非常大。我注意到,在處理完這種請求(返回大的XML)後,內存不會被釋放。 所以,我已經分離的問題,並創造了這個一個很短假例如: import cherrypy from lxml import etree class Server: @cherrypy.expose

    2熱度

    1回答

    如何遍歷具有特定屬性值的特定值的所有標籤?例如,假設我們只需要data1,data2等。 <html> <body> <invalid html here/> <dont care> ... </dont care> <invalid html here too/> <interesting attrib1="naah, it is not

    0熱度

    1回答

    我試圖解析編碼爲utf-8的文件。除了寫入文件之外,沒有任何操作存在問題(或者至少我認爲是這樣)。最小工作示例如下: from lxml import etree parser = etree.HTMLParser() tree = etree.parse('example.txt', parser) tree.write('aaaaaaaaaaaaaaaaa.html') 將examp

    0熱度

    2回答

    我一直在尋找了一會兒一個Python模塊/ API,做一些我認爲很簡單: 讀取XML文件 添加/編輯/刪除條目 到目前爲止我已經發現了幾個片段該接口與複雜的面向對象的數據庫,但沒有死簡單: xml = etree.parse ('file.xml') xml.add(xpath, new_node(attrs)) xml.remove(xpath) xml.edit(xpath, new_

    0熱度

    2回答

    對於客戶,我必須在SUSE Linux Enterprise Server 11,64位(簡稱:SLES 11)上安裝django網絡服務器。 當我添加庫從http://software.opensuse.org我可以安裝python-LXML: sudo zypper install python-lxml 的結果是,該網站-軟件包安裝在/usr/lib/python2.6/site-pac

    3熱度

    1回答

    我有一個生成NewsML類型XML文件的工具,我想在生成文件後驗證它們。 我收到一個錯誤: Attempt to load network entity http://www.w3.org/TR/ruby/xhtml-ruby-1.mod 蟒蛇電話是: parser = etree.XMLParser(load_dtd=True, dtd_validation=True) treeObject

    3熱度

    2回答

    In [1]: from lxml import etree 我有一個HTML文檔丟失的文檔類型: In [2]: root = etree.fromstring(u'''<!DOCTYPE HTML PUBLIC "-//IETF//DTD HTML//EN">\n<HTML></HTML>''', etree.HTMLParser()) 它的DOCTYPE被正確解析: In [3]:

    0熱度

    1回答

    我想LXML清潔用它來擺脫所有的HTML,但隨後一個正則表達式自動鏈接的東西: [ABC] -> <a href="bah bah bah">ABC</a> 什麼是處理這種不XSS和這樣的路嗎?

    0熱度

    1回答

    我使用lxml.html.cleaner從輸入文本中清除html。如何在lxml.html中將\n更改爲<br />?