2012-10-12 177 views
2

我試圖在我的網站上支持多種語言。某些需要翻譯的內容將具有像Ç這樣的實體參考。我可以使用htmlentities將其轉換爲Ã。但是,如果我有什麼需要翻譯,有一個字符串標記:有HTML的情況下的內容

"<p>Hello, <a href="">world with Ç</a></p>" 

如果我使用htmlentities,在<>將被轉換了。我不想將字符串分解爲標籤和非標籤部分,然後將htmlentities僅應用於非標籤部分。這太雜亂和乏味。

+0

如何使用Unicode編碼如UTF-8? – Gumbo

+0

我在IE中看到奇怪的字符。我會研究UTF-8角度。 – StackOverflowNewbie

+0

您需要[正確指定文檔的字符編碼](http://www.w3.org/TR/html4/charset.html#h-5.2.2)。 – Gumbo

回答

1

一個解決張貼here

通過你的字符串下面的函數,並返回的字符串工作。

function unicode_escape_sequences($str){ 
     $working = json_encode($str); 
     $working = preg_replace('/\\\u([0-9a-z]{4})/', '&#x$1;', $working); 
     return json_decode($working); 
    } 
相關問題