lxml

1熱度

1回答

我嘗試使用表單解析輔助頁面。我使用的示例代碼源從這個鏈接： http://blog.ianbicking.org/2007/09/24/lxmlhtml/ 在我的測試我使用這個網址：http://www.infofer.ro/ 像例子中，我用這個值： >>> pprint(form.form_values()) [('cboData', '8/30/2010'), ('txtPlecare',

2熱度

1回答

PHP中的LXML庫？

是否有人在PHP中找到LXML的類。我不知道python。如果有人發現類或庫或教程，請與我分享感謝， Nithish

7熱度

5回答

問題，它會安裝但模塊未發現

在 lxml 2.2.7 is already the active version in easy-install.pth Removing lxml-2.2.7-py2.5-macosx-10.3-i386.egg from site-packages and rerunning sudo easy_install lxml results in Adding lxml 2.2.7 to

2熱度

1回答

問題解析XML

您好我有xml文件whitch我想分析，它看起來像這樣 <?xml version="1.0" encoding="utf-8"?> <SHOP xmlns="http://www.w3.org/1999/xhtml" xmlns:php="http://php.net/xsl"> <SHOPITEM> <ID>2332</ID> ... </SHOP

0熱度

1回答

在lxml中對錶格進行分類

我正在處理大量的html文檔。我的任務之一是從文檔中提取所有文本。我已經得到了很多，但現在我因爲使用表格作爲容器/格式化結構來獲得非數字性質的信息而難住了我的目標是忽略 - 留下 - 不提取'表'是一個數字字段表我準備實施基於暴力規則的方法，通過獲取一個表，並且如果超過一定比例的td.text_content（）可以分類爲數字，我將決定該表是一張數值表我想知道如果別人可以建議更好的方法

2熱度

1回答

如何使用LXML

我試圖從使用lxml的最好的我已經能夠做到，得到的元素的列表中刪除評論進入評論是： no_comments=[element for element in element_list if 'HtmlComment' not in str(type(each))] 我想知道如果有更直接的方法？我會根據馬修的回答添加一些東西 - 他幾乎在那裏得到了我的問題是，當元素從樹中取出時，註釋會失去一些

7熱度

1回答

Python Lxml - 用新數據追加現有的xml

我是python/lxml的新手在閱讀lxml網站並深入python之後，我找不到解決方案給我的n00b煩惱。我有以下XML示例： --------------- <addressbook> <person> <name>Eric Idle</name> <phone type='fix'>999-999-999</phone> <phone typ

4熱度

4回答

掌握LXML非連續文本/ ElementTree的

假設我有這種HTML，從中我需要選擇「文本2」使用LXML/ElementTree的： <div>text1<span>childtext1</span>text2<span>childtext2</span>text3</div> 如果我已經有div元素作爲mydiv，那麼mydiv.text只返回「text1」。使用itertext（）看起來有問題或麻煩，因爲它遍歷div下的整個樹。是

3熱度

1回答

如何使用lxml在屬性值中設置命名空間前綴？

我正在嘗試使用lxml創建XML模式。對於的遊戲內是這樣的： <xs:schema xmlns="http://www.goo.com" xmlns:xs="http://www.w3.org/2001/XMLSchema" elementFormDefault="qualified" targetNamespace="http://www.goo.com"> <xs:element

1熱度

5回答

BeautifulSoup用戶的html5lib/lxml示例？

我試圖從BeautifulSoup，我愛自己戒掉，但似乎是（積極）不支持。我試圖用html5lib和lxml的工作，但我似乎無法弄清楚如何使用「查找」和「的findAll」操作符。通過查看文檔的html5lib，我想出了這個一個測試程序： import cStringIO f = cStringIO.StringIO() f.write(""" <html> <body