2014-02-08 74 views
2

我是XML路徑語言的新手。我想要的是使用一個工具來獲取XPath以便在腳本中使用以獲取內容。如何獲得正確的XPath?

例如:

http://econpy.pythonanywhere.com/ex/001.html我想獲得的所有買家的名字。

我已經嘗試過Firebug和Chrome DevTools,但它們似乎都產生了一條路徑,這不適合我的目的。我得到/html/body/div[2]/div,而應該是//div[@title="buyer-name"]/text()

(我用http://docs.python-guide.org/en/latest/scenarios/scrape/)。

任何建議將不勝感激。

回答

3

有一個名爲FirePath的Firebug擴展,它增強了Firebug與XPath相關的功能。最近在Firebug中實現了一項新功能,它允許使用copy the minimal XPath

他們兩人都創建基於帶有ID的元素的路徑,所以我創建了一個enhancement request for Firebug以允許您要求的內容。而且我還對現有的feature request for FirePath進行了評論,該目標以此爲目標。

+0

偉大的你已經實現了相對XPath增強塞巴斯蒂安!我可以看到它仍然是一個懸而未決的問題,是否仍然有辦法在Firefox中安裝它?謝謝 –

+0

實際上是Jakob在Firebug中實現了這個功能(對於帶有ID的元素)。未解決的問題涉及基於*無* ID的元素的相對XPath。由於問題仍然存在,它尚未在Firebug中提供。如果你想要這個功能,你可能想爲[Firebug.ne​​xt](https://github.com/firebug/firebug.ne​​xt)寫一個補丁。 –