2017-05-26 46 views
0

我需要自動從網頁下載文檔(使用Python腳本)。在HTML頁面,鏈接如下所示:HTML鏈接背後的文檔名稱?

href="https://foo.bar/view.php?id=123456" 

當我點擊在Web瀏覽器這樣的鏈接時,打開Web瀏覽器與它的正確名稱的文件 - 例如:document_1.pdf

然而,當我下載同樣的文件用的wget:

$ wget https://foo.bar/view.php?id=123456 

我得到了正確的文件,而是以不同的名稱:[email protected]=123456

現在,該文件的真實姓名(document_1.pdf在這個例子中)在HTML頁面中沒有出現。我怎麼才能得到它?

如果Web瀏覽器有可能獲得文檔的名稱,那麼腳本也可以這樣做,但是怎麼做?

+3

文件下載服務器響應包含在[頭](https://stackoverflow.com/questions/1628260/downloading-a文件名-file上帶有一個-不同-名稱到所述存儲的名稱)。 – James

+0

是的,就是這樣。謝謝! – user1387866

回答

1

解決的評論:

The file download server response contains the file name in a header. – James