0
我有一個表單,由Python機械化瀏覽器返回,並通過forms()方法獲得。如何在窗體節點中執行XPath搜索,即在HTML窗體節點的後代節點之間進行搜索? TIA如何在Python ClientForm對象內搜索XPath?
Upd: 如何保存表單的html代碼?
我有一個表單,由Python機械化瀏覽器返回,並通過forms()方法獲得。如何在窗體節點中執行XPath搜索,即在HTML窗體節點的後代節點之間進行搜索? TIA如何在Python ClientForm對象內搜索XPath?
Upd: 如何保存表單的html代碼?
通過使用lxml解析瀏覽器內容,它具有xpath支持。
所以你的意思是機械化使用的解析器不支持xpath? (哪一個是btw?) – Fluffy 2009-10-02 13:18:25
快速瀏覽源代碼說它使用正則表達式來查找鏈接和ClientForm來查找表單。 ClientForm反過來似乎使用sgmllib。在任何地方都沒有xml。 :) – 2009-10-02 14:11:29
看起來像form_parser_class用於解析表單,如果None用於初始化工廠,則設置爲ClientForm.FormParser,但也許可以將其設置爲另一個解析器,例如ClientForm.FormParser周圍的包裝保存表單的源html? – Fluffy 2009-10-02 16:13:02