我需要編寫一個函數,用於下載和存儲當前的預發佈域名.txt文件的列表 http://www.namejet.com/pages/downloads.aspx.
因此,今天是10月8日,您希望獲取文件「2012年10月8日星期一」。 嘗試請求,但沒有奏效。 我遇到了麻煩,因爲該文件沒有存儲在固定的URL上,但隱藏在一些Javascript後面。如何使用Python從網站下載文本文件?
回答
這一個有點棘手,因爲你正在處理ASP.NET的postback系統。如果這不適用於個人腳本以外的任何內容,我會保持警惕,因爲您實際上不僅使用其他站點的數據,而且還對其軟件進行逆向工程(但是,IANAL並不知道網絡中涉及這些問題的合法性問題)系統)。
您要做的是檢查POST數據(使用Firebug,Chrome開發人員工具等)並查找表單對象的__EVENTTARGET
和__VIEWSTATE
屬性。您必須將__VIEWSTATE
解碼爲可讀(請參閱http://ignatu.co.uk/ViewStateDecoder.aspx)。從那裏,我認爲你應該能夠找出如何獲得你正在尋找的數據。
從Python的,它是那麼容易,因爲:
from urllib2 import urlopen
from urllib import urlencode
data = urlopen('url', urlencode({
'__VIEWSTATE': 'foo',
'__EVENTTARGET': 'bar',
})).read()
實際上,您將獲得文本文件以響應具有多個base64編碼請求參數的POST請求。隨時用它
使用螢火蟲或其他任何調試工具來玩玩看帖子內容和參數
你有它的一些教程? –
@DemianBrecht回答比我好很多,希望它有助於:) – Marat
- 1. 使用Python從網站下載文件
- 2. 使用python從網站下載文件
- 3. 如何使用python和BeautifulSoup從網站下載.qrs文件?
- 4. 如何使用python從網站下載mp3文件
- 5. SILVERLIGHT。如何從網站下載文件
- 6. 如何從C#網站下載文件?
- 7. 如何從網站下載.cs文件?
- 8. 如何從網站下載文件?
- 9. 從網站下載文件
- 10. 從網站下載文件
- 11. 如何禁用文件從網站使用vb.net下載?
- 12. 使用對話框從python網站下載文件
- 13. 如何從Python的ASP網站下載文件?
- 14. 如何使用cURL從網站下載文件
- 15. 如何僅使用wget從網站下載.exe文件?
- 16. 如何從服務器下載文件,使用asp.net網站
- 17. 如何使用Python從網頁下載文本文件或某些對象?
- 18. 我如何從網站下載文章?
- 19. 如何自動將文件從網站下載到文件夾
- 20. 如何使用python從網頁下載.zip文件?
- 21. 如何使用python從網頁下載文件
- 22. 如何從使用javascript的網站下載文件時重命名文件?
- 23. 從網上下載網站,從本地文件中下載數據
- 24. 從網站下載文件解析
- 25. 從網站下載音頻文件
- 26. 從網站下載CSV文件
- 27. 從網站下載文件PHP
- 28. 從網站下載臨時文件
- 29. 從多語言網站下載文件
- 30. 從網站自動下載XLS文件
你好Demian。我知道後續跟進有點晚。我使用了Chrome開發人員工具,發現了您提到的兩個屬性!現在我可以在哪裏繼續?如何從該網站獲取預發佈域名列表? –