我需要從網站中刪除所有不友好的html字符我使用curl和simplehtml dom解析。在PHP中刪除
<?php
$html = "this is a text";
var_dump($html);
var_dump(html_entity_decode($html,ENT_COMPAT,"UTF-8"));
其輸出
串(19) 「這是一個 文本」
串(15) 「這個is┬áa文本」
我不因爲文本中還有其他字符(例如&度),所以要使用preg *。 這讓我瘋狂了!
謝謝, 詹姆斯
他說:「我需要刪除所有可惡的html字符」,而不僅僅是 。有趣的立即upvotes。 – Coder1 2013-03-07 17:33:42
不情願不得不採取這種方法,但不高興,因爲它意味着如果任何HTML字符我沒有考慮彈出,我的解決方案中斷。儘管我沒有回答這個問題。我考慮的一個解決方案是#&[a-zA-Z];#和普通英語一樣,在&符號周圍總會有一個空格。 – James 2013-03-11 09:47:55