2016-10-09 38 views
1

我正在專門查看ReferenceUSA網站。要下載信息,必須手動選擇所有項目,然後單擊下載,然後在另一頁上單擊以生成CSV文件。無論如何要自動化這種過程?腳本在參考網站上下載手動生成的excel文件?

+0

任何代碼或研究這麼遠? – techydesigner

+1

查看網頁抓取,HMTL解析器('lxml'和'BeatifulSoup')以及可能的Python模塊'mechanize'。或向我們展示您的代碼。 – dkasak

+0

謝謝,我已經研究過美麗的湯,但沒有看到這將如何幫助我生成CSV文件,但理論上我應該能夠複製已經在頁面上的數據表(雖然這看起來效率很低) 。 – numbersloth

回答

0

你可以試試Selenium,這裏是一個打開網頁的例子,然後點擊一個按鈕。

>>> from selenium import webdriver 
>>> browser = webdriver.Chrome() ## now web browser opened 
>>> browser.get("https://www.python.org") ## now python.org web page opened 

有一個按鈕 「GO」,其頁面的源代碼是這樣的:

button type="submit" name="submit" id="submit" class="search-button"... 

現在,點擊這個按鈕

>>> browser.find_element_by_id("submit").click()