2013-04-17 31 views
0

我需要清除所有HTML,CSS和JS代碼中的一些文本。PHP - 從所有html,css和JS代碼中清除文本

我正在使用這個函數,但有時候,有一些內聯代碼。

你有比我使用的更好的功能嗎?

這裏是我的代碼:

function cleanContent($str){ 
    $str = str_replace(array(" "), " ",str_replace(array(" "), "", $str)); 

    $pattern3 = "/\..*?{.*}/"; 
    $str = preg_replace($pattern3,"",$str); 

    $pattern1 = "/#.*?{.*?}/"; 
    $str = preg_replace($pattern1,"",$str); 

    $pattern2 = "/.:.*?{.*?}/"; 
    $str = preg_replace($pattern2,"",$str); 

    $pattern4 = "/(body|ul|li|a|img|tr|td|html)\s{.*?}/"; 
    $str = preg_replace($pattern4,"",$str); 

    return $str; 
} 
+1

你有沒有考慮使用strip_tags - http://php.net/manual/en/function.strip-tags.php? – Pankucins

回答

3

從HTML您應該使用用strip_tags()清潔;

string strip_tags (string $str [, string $allowable_tags ]) 

第二個參數是帶有允許標籤的數組。編寫自己的功能是沒有意義的。

此功能將刪除包含在和標記中的css和js。

+0

那麼這個功能只有在製作好的標籤時才能正常工作。但在我的情況下,標籤是不可用的。那麼該怎麼辦? –