2012-08-06 24 views
2

我想解析一個web文檔(基於表格設計),並且我有一個帶有表格的div。簡單的XPath表達式在Python中不起作用

<div id="component"> 
    <table ...> 
     .... 

如果我嘗試:

XmlXPathSelector(response).select("//*[@id='component']") 

這工作:

[<XmlXPathSelector xpath="//*[@id='component']" data=u'<div xmlns="http://www.w3.org/1999/xhtml'>] 

但如果我要列出包含表:

XmlXPathSelector(response).select("//*[@id='component']/table") 

這將返回一個空結果。我嘗試了其他選擇器,如"//*[@id='component']/tr""//*[@id='component']/a",但那些也不起作用。

任何想法可能是錯誤的?

+1

請張貼'HTML document'。 – RanRag 2012-08-06 19:43:30

+1

從您的示例中,它應該是「新聞」而不是「組件」。 – 2012-08-06 19:44:55

+0

是的,我知道,我是寫這個HTML作爲示例,這不是問題。 – Exos 2012-08-06 19:49:52

回答

0

:P我解決了這個,我是用XmlPathSelector而不是* HTML * PathSelector

相關問題