我用curl解析了一些html代碼。某些網站的html源代碼如下:從html源碼刪除php短標籤
<div id="content">
some words
</div>
<?
$box_social['dimensioni']="80";
$box_vota=array();
$box_vota["novideo"]='';
$box_vota["nofoto"]='';
$box_vota["id_articolo"]='1003691';
include($_SERVER['DOCUMENT_ROOT']."/incs/box_social.php");
?>
<div id="footer">
some words
</div>
如何從html源代碼移除php短標籤?我需要
<div id="content">
some words
</div>
<div id="footer">
some words
</div>
而且我使用preg_replace('/<\?(.*?)\?>/','',$html);
,但php的短標籤部分仍然存在。
你提到你正在用curl來解析它嗎?那麼你通過網絡服務器解析的東西呢?它不會以這種方式工作。 –
如果您通過URL獲取PHP代碼,那麼在服務器或服務器配置的另一端會出現嚴重的問題。如果這是第三方網站,那麼您應該立即通知他們,因爲這可能也是他們的安全問題。你不應該過濾這些東西,因爲他們不應該讓服務器首先輸出它。 – SDC