簡單的XPath表達式在Python中不起作用

我想解析一個web文檔（基於表格設計），並且我有一個帶有表格的div。簡單的XPath表達式在Python中不起作用

<div id="component"> 
    <table ...> 
     ....

如果我嘗試：

XmlXPathSelector(response).select("//*[@id='component']")

這工作：

[<XmlXPathSelector xpath="//*[@id='component']" data=u'<div xmlns="http://www.w3.org/1999/xhtml'>]

但如果我要列出包含表：

XmlXPathSelector(response).select("//*[@id='component']/table")

這將返回一個空結果。我嘗試了其他選擇器，如"//*[@id='component']/tr"和"//*[@id='component']/a"，但那些也不起作用。

任何想法可能是錯誤的？

2012-08-06 Exos

請張貼'HTML document'。 – RanRag 2012-08-06 19:43:30

從您的示例中，它應該是「新聞」而不是「組件」。 – 2012-08-06 19:44:55

是的，我知道，我是寫這個HTML作爲示例，這不是問題。 – Exos 2012-08-06 19:49:52

：P我解決了這個，我是用XmlPathSelector而不是* HTML * PathSelector

2012-08-06 20:04:55 Exos

回答