我有一個網頁,有如下內容(我已經改變了網址爲隱私的目的SRC標籤,否則查看頁面源是相同的):如何刮用JavaScript從網站圖片和servlet
<HTML>
<BODY>
<script type="text/javascript" src="http://localhost/servlet?publicKey=abcdefg12345678&"></script>
</BODY>
</HTML>
生成的頁面在瀏覽器中顯示圖像,我試圖抓取該圖像。在我刮掉圖像後,我嘗試爲圖像建立索引(請參閱www.tineye.com以瞭解圖像搜索引擎的想法)並存儲它們。如果有人知道如何從這些網站上刮取圖片,請告訴我。
注:SRC不包含有關圖像的任何信息......它只調用使用公鑰作爲參數給定的servlet。我上面發佈的內容完全是我在瀏覽器(Firefox)中單擊查看 - >頁面源時看到的。當然,我已經更改了隱私問題的實際URL和公鑰,否則所有內容都是相同的。
我似乎已經用於一些橫幅類似的技術:http://coldjava.hypermart.net/servlets/banner.htm
另一種方法是在瀏覽器中打開網頁,把網頁的快照和寫屏幕抓取代碼來獲得圖像。我不確定是否有一個更簡單的解決方案來解決我的問題,但如果有問題的話,這將非常棒! :) – Kiril 2010-01-26 21:41:04