2011-11-12 81 views
0

我使用Scrapy(一種Python網頁抓取框架)從網站上下載PDF文件。使用Scrapy下載PDF文件

該網站需要遵循同一屆會議,以便讓您下載pdf。

它適用於Scrapy's,因爲它全部自動化,但是當我在幾秒鐘後運行腳本時,它開始給我假pdf文件,例如當我嘗試直接訪問pdf時,沒有我的會話。

這是爲什麼&怎麼解決這個問題?

+3

要求他們慢?我敢打賭,他們是限速你。 – kindall

+0

你是對的,但它需要更長的時間和下載速度我無法完成我的任務,因爲需要下載大量的PDF文件。 – Kex

回答

0

我認爲該網站會跟蹤您的會話。如果它是一個PHP站點,請將PHPSESSID cookie傳遞給下載PDF文件的請求。