我刮站點刮自己的形象,尋找JPG格式下載。
颳去網站的HTML頁面正常工作。
但是,當我試着用CURL,copy(),fopen()等獲得JPG時,我得到了一個403 forbiden狀態。如何解決網站禁止我使用PHP
我知道這是因爲網站所有者不希望自己的圖片被刮掉,所以我明白一個好的回答會是就是不這樣做,因爲他們不希望你。
好的,但是讓我們說這是確定的,我嘗試解決這個問題,如何實現這一目標?
如果我通過瀏覽器獲得相同的URL,我可以完美地打開圖像,這並不是說我的IP被禁止或任何其他內容,並且我一次測試一個文件,所以它不會阻止我,因爲我經常提出太多要求。
從我的理解,這可能是因爲無論是網站正在檢查一些餅乾是確認我使用的瀏覽器和瀏覽他們的網站之前,我下載一個JPG。
或者也許PHP正在使用某些用戶代理來處理服務器可以檢測和過濾的請求。
無論如何,有什麼想法?
的問題是不是「我應該這樣做或不」,這是「如何** **可我做到這一點。」當人們迴避問題時,我真的很討厭它,因爲他們想要道德上正義。 @Petruza首先檢查HTTP Referrer欺騙。儘管如此,您可能希望完全模仿瀏覽器標題。 – Leigh 2012-03-29 07:15:04
@Juhana:什麼時候刮網站變得違法? – Petruza 2012-03-29 07:59:19
維基新聞和大多數英國。政府網站有一項公共政策,規定信息可以重複使用,但私下將其作爲一種自動化程序難以實施。 – Skizz 2012-03-29 17:27:38