我想從數據庫中下載幾個特定的DNA序列。 (http://medicago-mutant.noble.org/mutant/FNBline1.php?id=NF-FN+8113) 我可以輕鬆解析該頁面上的靜態鏈接,並關注它們,但是從下一頁我無法獲取我想要下載的文件的鏈接(http://gb.sc.noble.org/cgi-bin/gb2/gbrowse/medicago3_5/?name=CHR02FS001028027)它位於「Go」按鈕下。有沒有辦法獲得這些信息,或自動推送該按鈕? 該按鈕會觸發一個javascript,打開一個新窗口並立即開始下載該文件。 我一直在使用urllib2下載網站,但它似乎沒有任何意義來解析鏈接的源代碼。Python:抓取網頁:需要幫助抓取特定鏈接或自動點擊按鈕
-1
A
回答
0
首先,網站提供了一個鏈接,下載所有文件的tar球?
我對urllib2沒有經驗,但以我的經驗硒(http://docs.seleniumhq.org/)應該能夠很容易地做到這一點。只需打開Selenium IDE(一個瀏覽器插件)並記錄您想要下載的鏈接的ID,然後使用python將其自動化。硒網站提供了詳細的說明(http://docs.seleniumhq.org/docs/)。你也可以在SO上搜索,因爲這裏有很多答案。
還有很多其他的工具,如Watir,Sahi,WatiN等等。你可以在這裏找到一個不完整的列表:Web Automation Tool和這裏:http://en.wikipedia.org/wiki/List_of_web_testing_tools。
相關問題
- 1. 網頁抓取:自動按鈕點擊
- 2. 需要幫助的網頁抓取 - 獲取特定的內容...
- 3. 我需要幫助網絡抓取
- 4. 需要幫助網頁抓取網頁及其鏈接通過自動功能在R
- 5. 從網頁抓取值,無需刷新頁面或點擊按鈕
- 6. 網頁抓取:按javascript按鈕
- 7. 需要關於網頁抓取中的字符串匹配的幫助,python
- 8. 需要鼠標點擊的網頁抓取?
- 9. Scrapy網頁抓取工具無法抓取鏈接
- 10. 抓取與rvest網站(改變頁面,點擊鏈接)
- 11. 需要幫助在perl中抓取一個網站
- 12. 網絡抓取鏈接表
- 13. 抓取網頁和存儲鏈接
- 14. 網頁抓取和鏈接評估
- 15. 需要幫助,點擊一下按鈕
- 16. Python - 網頁抓取問題
- 17. 在python中抓取網頁
- 18. Python的網頁抓取 - UnicodeEncodeError
- 19. Python網頁抓取data-val?
- 20. 的Python - 網頁抓取 - BeautifulSoup
- 21. Python的SSL網頁抓取
- 22. Xpath Python網頁抓取
- 23. 網頁抓取,python和beautifulsoup
- 24. 需要幫助點擊的Watir網絡驅動器按鈕
- 25. 從網頁抓取特定信息
- 26. HTMLAgility幫助屏幕抓取
- 27. 網頁抓取 - 如何獲取一個網絡鏈接的特定部分
- 28. 網頁抓取/屏幕抓取
- 29. 網頁抓取/抓取的資源
- 30. 網頁抓取動態內容與Python
你在用什麼刮? (Scrapy等?)這將有助於澄清您正在尋找哪些幫助工具,或者如果您願意切換庫。 – DreadPirateShawn
我使用urllib2模塊,但我絕對開放任何解決方案。 – szabadkai
另外,你知道「Go」按鈕是否打開一個新窗口,立即開始下載,觸發JavaScript事件等?任何有關您當前使用的其他信息(例如urllib2)以及您遇到的具體問題將是理想的問題,以便幫助任何可能提供幫助的人。就目前而言,這個問題有可能導致結果過於開放。 – DreadPirateShawn