最好使用python(當前使用urllib和BeautifulSoup)給出一個URL。屏幕抓取圖像(即Firefox頁面信息/ Google圖像)
比如我想湊這個頁面上的主照片:http://www.marcjacobs.com/marc-jacobs/womens/bags-and-accessories/c3122001/the-single#?p=1&s=12
在Firefox下的工具>頁面信息>媒體列出了所有的可見光圖像,包括鏈接到我要搶圖像( http://imagesec.mj.ctscdn.com/image/336/504/6ace6aac-c049-4d7e-9465-c19b5cd8e4ac.jpg)
兩個相互關聯的問題:
- 如果我從 Firefox的工具檢索到的圖像的路徑不是在HTML文檔中發現了一個查看源代碼...有沒有什麼辦法可以找回這個 路徑沒有通過Firefox頁面信息?也許通過 Python和/或Javascript/JQuery?
- 我試圖獲得「橙色」的產品的照片,並注意頁面總是默認加載黑色
的工作的例子可能是谷歌「購物」如果鍵入,此產品的名稱並選擇顏色,圖像以正確的顏色(來自完全相同的頁面)顯示在搜索結果中。
基本上,我想能夠從大多數購物網站刮顏色和風格/變化特定的圖像。
選擇正確的顏色好像比較複雜,在這種情況下我會滿足於僅僅在黑色作爲主產品圖像現在..
到目前爲止,我已經試過基於IMG高度標記選擇圖像,也試圖在沒有高度/寬度標籤時讀取尺寸......但對我而言,必須有更好的方法。
忘了提及你想要元素的背景屬性。您鏈接的頁面不使用img標籤。 –
謝謝!我會嘗試這個併發布任何更新。嗯,即使你連接到網站,也需要許可嗎?我只打算將它們用作縮略圖..無論如何我會仔細研究它。 此外,我希望我可以刪除在谷歌搜索點擊橙色縮略圖的步驟。不知道他們是如何自動從同一頁面檢索該圖像的。也許這是最高機密,因爲我還沒有看到任何其他例子:) – Miu
沒問題。我擔心你幾乎總是需要許可。詢問他們,如果他們看起來不太熱心,你可以提供鏈接或類似的東西(或支付)。至於谷歌搜索的事情,請記住,網頁使用技術,以允許網絡爬蟲訪問他們的內容。讓我糾正自己:他們使用img標籤,他們指向CDN,所以他們可能會讓Google抓取它。然而,我只是搜索了一些描述和顏色,但我找不到通過Javascript生成的相同圖像。 –