2
我想解析一個web文檔(基於表格設計),並且我有一個帶有表格的div。簡單的XPath表達式在Python中不起作用
<div id="component">
<table ...>
....
如果我嘗試:
XmlXPathSelector(response).select("//*[@id='component']")
這工作:
[<XmlXPathSelector xpath="//*[@id='component']" data=u'<div xmlns="http://www.w3.org/1999/xhtml'>]
但如果我要列出包含表:
XmlXPathSelector(response).select("//*[@id='component']/table")
這將返回一個空結果。我嘗試了其他選擇器,如"//*[@id='component']/tr"
和"//*[@id='component']/a"
,但那些也不起作用。
任何想法可能是錯誤的?
請張貼'HTML document'。 – RanRag 2012-08-06 19:43:30
從您的示例中,它應該是「新聞」而不是「組件」。 – 2012-08-06 19:44:55
是的,我知道,我是寫這個HTML作爲示例,這不是問題。 – Exos 2012-08-06 19:49:52