2014-09-04 72 views
-1

我有一個鏈接到有嵌入PDF的頁面。我想用任何代碼下載這個pdf文件,但我不能。下載它的唯一方法是單擊下載按鈕,或將mozilla首選項設置爲自動下載。需要使用url下載PDF

但這並不能滿足我的需要。我曾嘗試使用Python,JavaScript,但仍無法下載它。

有人可以告訴我一種方法來獲得任何方法下載的PDF? (最好能指定自己的目錄/文件名)和Python

+2

展一些代碼。你試過了什麼? – fledgling 2014-09-04 13:54:36

+0

你可以發郵件了嗎? – ChillarAnand 2014-09-04 13:56:57

+0

如果有下載按鈕,那麼很有可能會有.pdf的直接url。檢查頁面的來源,找到該URL。可能讓你開始。 – 2014-09-04 13:57:23

回答

0

下載文件:

sudo pip install pattern 

download.py:

from pattern.web import URL 

url = URL('http://www.nytimes.com/images/2014/09/03/nytfrontpage/scan.pdf') 
f = open('nytimes.pdf', 'wb') 
f.write(url.download(cached=False)) 
f.close() 

運行:

python download.py 
+0

謝謝@Moogs。我早些時候嘗試過這個確切的代碼,但它沒有解決。 只有在HTML中的頂部欄被轉換爲pdf,但其下面的實際PDF文件不會被添加。 – iceman 2014-09-05 10:13:44