2017-10-19 74 views
2

我嘗試做一些網頁搜刮在網頁搜索期間修改HTML內容

目的是根據郵政編碼收集所有的補救措施。問題是當我嘗試我的代碼時,我的列表是空的,因爲url根據郵政編碼沒有改變。這就是爲什麼我想在修改過程中更改HTML值的原因。

我不知道如何做到這一點。我嘗試使用SeleniumXPATH但是我無法找到任何東西。

這裏的HTML代碼:(紅色是我需要改變。)

編輯:的確,我們的目標是根據郵政編碼來收集與名稱的分頁和補救的類型,這這就是爲什麼我想在報廢期間更改HTML內容的原因。

這是我可以暫時做的最好的,我希望你會看到錯誤

+2

嗨,你需要包括相關的代碼。你有什麼嘗試?也沒有人知道如何使用那個不是英文的頁面。假設我點擊您提供的第一個鏈接,然後點擊*「Spécialistesdu vitrage」*,輸入法語郵政編碼75020並按搜索按鈕。我可以看到分頁結果列表。那是你要的嗎?那麼,如果是這樣,Selenium應該能夠得到它,不管URL是否改變。請編輯你的問題。 – derloopkat

回答

1

此輸入的形式,這是一件好事,因爲Selenium具有特殊的功能來處理形式。

from selenium import webdriver 

url = "https://www.maif.fr/services-en-ligne/consultationreparateurs/geolocaliserReparateur.action?view" 
query = "whatever you want to put into the search box" 
driver = webdriver.Chrome() 
driver.get(url) 
webform_input = driver.find_element_by_xpath("//input[@id='adresseInternaute']") 
webform_input.send_keys(query) 
webform_input.submit() 

這裏的關鍵是submit()。它將遍歷HTML樹,直到它在當前表單中找到一個按鈕,這意味着您不必再多寫兩行來單擊搜索按鈕。