2011-04-13 43 views
0

我想用simple_html_dom來獲取一些網站的圖片。這是一個測試網站。當我使用下面的一些基本代碼時,我可以得到所有的圖像。但如何過濾廣告圖片?如何在使用`simple html dom`獲取網站圖片時過濾廣告圖片

<?php 
header('Content-type:text/html; charset=utf-8'); 
require_once 'simple_html_dom.php'; 
$v = 'http://www.vimeo.com/'; 
$html = file_get_html($v); 
foreach($html->find('img') as $element) { 
      $image = $element->src; 
      echo '<img src="'.$image.'" /><hr />'; 
     } 
?> 

我注意到有些廣告還爲jpg image format,但網址中包含adads,或者說只是作爲一個gif image format ...如何編寫一些代碼來過濾廣告?謝謝。

回答

0

如果找到廣告字符串,請在您的src中搜索。但是,這太玉米粥posibility,像adminaddressreading ...

if (!preg_match("ads?", $element->src)) { 
    //it's not an ad 
} 
+0

是的preg_match支持的'array'?如果我把'廣告,管理員,地址,閱讀'放在裏面...... – 2011-04-13 10:09:18