我一直在試圖找出這個問題一個星期左右,只是 不能提出一個很好的解決方案。所以,我想我會看看有沒有人可以幫助我。下面是我試圖刮鏈接:用HTTP頭掃描屏幕問題 - 我認爲
我右鍵單擊以複製圖像位置。 這是被複制的鏈接:
(不能粘貼爲鏈接,因爲我是新的) http:// content(dot)lib(dot)washington(dot)edu/cgi-bin /getimage.exe?CISOROOT=/alaskawcanada & CISOPTR = 491 & DMSCALE = 100.00000 & DMWIDTH = 802 & DMHEIGHT = 657.890625 & DMX = 0 & DMY = 0 & DMTEXT =%20NA3050%20%09AWC0644%20AWC0388%20AWC0074%20AWC0575 & REC = 4 & DMTHUMB = 0 & DMROTATE = 0
沒有清晰的圖像U RL正在顯示。很明顯,這是 ,因爲圖像隱藏在某種類型的腳本後面。通過試用和 錯誤,我發現我可以在「CISOPTR = 491」之後放入「.jpg」,然後該鏈接變爲圖像URL。問題是這不是圖像的高分辨率版本。要進入 高分辨率版本,我必須更改URL。我發現了很多文章@ Stackoverflow.com提到嘗試使用curl和PHP構建腳本,我甚至嘗試了其中的幾個,但沒有運氣。 「491」是圖像編號,我可以更改該編號以查找同一目錄中的其他圖像。所以,拼湊一系列數字應該很容易。但我仍然是一個刮鬍子的小老鼠,這個人正在踢我的屁股。這是我嘗試過的。
Get remote image using cURL then resample
也試過這樣。
http://psung.blogspot.com/2008/06/using-wget-or-curl-to-download-web.html
我也有智勝樞紐和站點吸盤,但他們不承認的URL爲圖像文件和FO他們只是通過正確的OVE它。我在一夜之間使用了SiteSucker,它下載了40,000個文件,只有60個文件是jpeg,其中沒有一個是我想要的。
我不斷遇到的其他問題是我手動下載的文件,文件名始終是getfile.exe或showfile.exe,然後如果手動添加「.jpg」作爲擴展名,我可以在本地查看圖像。
如何才能達到原始高分辨率圖像文件,並自動執行下載過程,以便我可以抓取幾百張這些圖像?
感謝您的回覆,並確認了我的一些假設。我對服務器端功能和行話極其缺乏經驗,所以請原諒任何不正確的措詞。我實際上一直在玩查詢字符串中的不同參數,並且我已經能夠將圖像作爲JPG的最大分辨率,我甚至已經複製並粘貼了我所纏繞的參數,而他們每次生成高分辨率JPG。如果能夠實現流程的自動化,那將是非常好的。舉例來說,這只是一個痛苦 – user1376196