2014-09-10 215 views
2

我想下載一個文件,該文件沒有使用機械化的URL。我嘗試.read(),但它給了我html文件,這是顯而易見的。這是我需要發送到>文件> accessionlist並點擊創建文件的網址http://www.ncbi.nlm.nih.gov/sra?term=SRP000714通過點擊下載按鈕使用Python下載文件

+0

它*確實*有一個網址。只是下載使用了一個發送POST數據的表單。找出它發送和複製的內容。 – simonzack 2014-09-10 23:35:15

+0

@simonzack你介意解釋一下嗎?我之前沒有使用HTML源代碼。 – abn 2014-09-10 23:37:59

回答

0

解決您的問題的一種非常非常非常懶惰的方式是使用網絡抓取工具。 我不想考慮請求時使用的一種是splinter。 雖然它是爲Web應用程序測試而開發的,但它足夠適合做一些網頁抓取。 看看Splinter文檔,在那裏一切都很好解釋。

哦,它只適用於Python 2,它不是很酷。

(當然也有更好的答案)