2012-06-12 412 views
8

我想從使用python和機械化的網站下載文件。我當前的代碼成功登錄到網站並打開包含下載鏈接的頁面。使用Python機械化下載文件

的下載鏈接爲:https://www.lendingclub.com/browse/browseNotesRawDataV2.action

該鏈接的信息是:

Link(base_url='https://www.lendingclub.com/browse/browse.action', url='/browse/browseNotesRawDataV2.action', text='', tag='a', attrs=[('class', 'master_pngfix'), ('id', 'browseDownloadAllLink'), ('href', '/browse/browseNotesRawDataV2.action')]) 

我用follow_link方法點擊鏈接:

br = mechanize.Browser() 
br.follow_link(url='/browse/browseNotesRawDataV2.action') 

然而,沒有任何反應並沒有下載文件。當我登錄時在瀏覽器中打開鏈接時,它會暫停幾秒鐘並下載文件。

如何使用Python下載文件?

+2

你啓用日誌記錄?你在那裏看到的任何東西?你嘗試「檢索」而不是follow_link? – niko

+0

如何啓用日誌記錄?我在Mac上使用Eclipse。我試過檢索並沒有發生任何事。有什麼方法可以將文件名保存爲? – user1137778

+1

你可以用'import logging; logging.basicConfig(level = logging.DEBUG)' –

回答

28

的人誰的興趣,這是解決方案:

br.retrieve('https://www.lendingclub.com/browse/browseNotesRawDataV2.action','l‌​oans.csv')[0]