2011-12-02 152 views
3

是否有腳本或服務或代碼片段或方法或任何可以從網址獲取縮略圖的縮略圖我不是指網站的快照,而是可以自動提取並用作帖子的圖像縮略圖,非常像Facebook中使用的那個。應該提取圖片img src =「xxxxxxx?url = google.com」。這將獲取谷歌徽標這從鏈接檢索圖像

回答

2

也許有現有的解決方案,但它不是真的很難實現:

  1. 你需要獲取遠程站點,例如與file_get_contents
  2. 任選使用Tidy來清理源HTML
  3. 解析輸出與XML parser如果使用整潔清潔取的數據,或HTML parser
  4. 取從站點中的第一n圖像(n應是一個相對較小的數字)
  5. 存放在緩存中設置此獲取圖像,因爲這個取,分析事情可能需要一段時間

評論:

  • 你可以從網站上獲取robots.txt檢查它是否是允許的使用/索引內容
  • 設置該遠程網站取一個超時,因爲如果該網站已關閉或慢會超時您現場還有
  • 限制併發抓取到一個網站,並在全球範圍內防禦DoS-ING
  • 你可以使用一個HTTP客戶端和限制取出的HTML數據大小,或使用HEAD HTTP方法來下載之前獲取Content-Length實際內容如果允許的話
+0

不要對遠程站點使用file_get_contents,請使用CUrl或fsocket。 – 2011-12-03 00:07:53

+0

親愛的@ MatthewR.Miller,你看過我的評論嗎? –

+0

是的,我做了,我喜歡你的答案,我只是讓他知道不要使用file_get_contents並使用一個http客戶端,就像你說的一樣...... file_get_contents()被學習php的人懶惰地使用,它的真的很難用於遠程文件。很好的答案!這是我自己寫的。 – 2011-12-03 20:23:52