lxml

5熱度

1回答

我有一個XML文件，是book.xml（http://msdn.microsoft.com/en-us/library/ms762271(VS.85).aspx）我想貓的books.xml，並得到所有書籍ID和類型的書ID。類似 cat books.xml | python reader.py 任何提示或幫助將不勝感激。謝謝。

5熱度

1回答

Cherrypy中的內存消耗

我在REST風格的Web服務中使用Cherrypy，服務器因此返回XML（使用lxml創建XML）。其中一些XML非常大。我注意到，在處理完這種請求（返回大的XML）後，內存不會被釋放。所以，我已經分離的問題，並創造了這個一個很短假例如： import cherrypy from lxml import etree class Server: @cherrypy.expose

2熱度

1回答

查找具有特定屬性值的所有標籤

如何遍歷具有特定屬性值的特定值的所有標籤？例如，假設我們只需要data1，data2等。 <html> <body> <invalid html here/> <dont care> ... </dont care> <invalid html here too/> <interesting attrib1="naah, it is not

0熱度

1回答

違反字符編碼

我試圖解析編碼爲utf-8的文件。除了寫入文件之外，沒有任何操作存在問題（或者至少我認爲是這樣）。最小工作示例如下： from lxml import etree parser = etree.HTMLParser() tree = etree.parse('example.txt', parser) tree.write('aaaaaaaaaaaaaaaaa.html') 將examp

0熱度

2回答

簡單的python lxml CRUD？

我一直在尋找了一會兒一個Python模塊/ API，做一些我認爲很簡單：讀取XML文件添加/編輯/刪除條目到目前爲止我已經發現了幾個片段該接口與複雜的面向對象的數據庫，但沒有死簡單： xml = etree.parse ('file.xml') xml.add(xpath, new_node(attrs)) xml.remove(xpath) xml.edit(xpath, new_

0熱度

2回答

如何在SLES 11,64位上安裝python-lxml？

對於客戶，我必須在SUSE Linux Enterprise Server 11,64位（簡稱：SLES 11）上安裝django網絡服務器。當我添加庫從http://software.opensuse.org我可以安裝python-LXML： sudo zypper install python-lxml 的結果是，該網站-軟件包安裝在/usr/lib/python2.6/site-pac

3熱度

1回答

使用DTD驗證XML無法使用lxml導入實體

我有一個生成NewsML類型XML文件的工具，我想在生成文件後驗證它們。我收到一個錯誤： Attempt to load network entity http://www.w3.org/TR/ruby/xhtml-ruby-1.mod 蟒蛇電話是： parser = etree.XMLParser(load_dtd=True, dtd_validation=True) treeObject

3熱度

2回答

LXML，當系列化

In [1]: from lxml import etree 我有一個HTML文檔丟失的文檔類型： In [2]: root = etree.fromstring(u'''<!DOCTYPE HTML PUBLIC "-//IETF//DTD HTML//EN">\n<HTML></HTML>''', etree.HTMLParser()) 它的DOCTYPE被正確解析： In [3]:

0熱度

1回答

帶有自定義標籤的lxml清潔劑？

我想LXML清潔用它來擺脫所有的HTML，但隨後一個正則表達式自動鏈接的東西： [ABC] -> <a href="bah bah bah">ABC</a> 什麼是處理這種不XSS和這樣的路嗎？

0熱度

1回答

Python lxml.html換行符？

我使用lxml.html.cleaner從輸入文本中清除html。如何在lxml.html中將\n更改爲<br />？