2009-10-02 9 views
0

我有一個表單,由Python機械化瀏覽器返回,並通過forms()方法獲得。如何在窗體節點中執行XPath搜索,即在HTML窗體節點的後代節點之間進行搜索? TIA如何在Python ClientForm對象內搜索XPath?

Upd: 如何保存表單的html代碼?

回答

1

通過使用lxml解析瀏覽器內容,它具有xpath支持。

+0

所以你的意思是機械化使用的解析器不支持xpath? (哪一個是btw?) – Fluffy 2009-10-02 13:18:25

+0

快速瀏覽源代碼說它使用正則表達式來查找鏈接和ClientForm來查找表單。 ClientForm反過來似乎使用sgmllib。在任何地方都沒有xml。 :) – 2009-10-02 14:11:29

+0

看起來像form_parser_class用於解析表單,如果None用於初始化工廠,則設置爲ClientForm.FormParser,但也許可以將其設置爲另一個解析器,例如ClientForm.FormParser周圍的包裝保存表單的源html? – Fluffy 2009-10-02 16:13:02