2012-03-07 34 views
0

我想獲得這兩個網站的牛皮癬患者的臨牀圖像爲研究目的:如何從網站上刮取全尺寸圖像?

http://www.dermis.net/dermisroot/en/31346/diagnose.htm

http://dermatlas.med.jhmi.edu/derm/

對於第一個網站,我嘗試了保存頁面與Firefox,但它只保存了縮略圖而不是全尺寸的圖像。我能夠使用名爲「downloadthemall」的firefox插件訪問全尺寸圖像,但它將每個圖像保存爲新的html頁面的一部分,我不知道任何提取圖像的方法。

我也嘗試過在我的大學的一臺linux機器上使用wget來鏡像網站,但我無法使其工作,並且仍然不確定原因。因此,我想知道是否可以很容易地寫出一個簡短的腳本(或任何方法是最簡單的),以(a)獲得第一個網站鏈接到的全尺寸圖像,和(b)獲得全部完整第二個網站上的圖像文件名爲「牛皮癬」。

我已經編程了幾年,但沒有web開發經驗,並會很樂意就如何去做這件事的任何建議。

+0

警告:在鏈接圖像皮膚病,如果你是吃不查看。 – 2012-03-07 00:07:37

+0

您可能需要一個網站鏡像程序,例如httrack(http://www.httrack.com/)。只要告訴它只保存圖像。有很多文件。 – Borealid 2012-03-07 00:15:11

回答

0

嘗試HTTrack網站複印機 - 它會加載網站上的所有圖像。您也可以嘗試http://htmlparser.sourceforge.net/。如果您在org.htmlparser.parserapplications中指定它,它將抓取網站.SiteCapturer