是否有一個函數可以從字符串中刪除所有非UTF-8字符?刪除或編碼非UTF-8字符
2
A
回答
10
如果您有一個可能包含無效字符的UTF-8字符串,則可以使用iconv
刪除這些字符。這應該工作:
$text = iconv("utf-8", "utf-8//ignore", $text);
使其與任意的佔位符可見是一個有點艱難 - 我想不出任何簡單的方法來做到這一點,總之通過每一個字節行走,看看它是否是一個有效的字符。 Wikipedia article提供了關於如何做到這一點的更多信息。
相關問題
- 1. 編碼字符串UTF8
- 2. JSON字符編碼vs utf8
- 3. 刪除HTML編碼字符
- 4. 下載xml,刪除bom並編碼utf8
- 5. 刪除4個字節的UTF8字符
- 6. 正則表達式從UTF8字符串中刪除非字母數字字符
- 7. 克服非utf8 url編碼
- 8. 從文件內容中刪除非UTF8字符
- 9. 使用正則表達式在Eclipse中刪除非utf8字符
- 10. 刪除所有非單詞字符,除非&或'模式
- 11. 寫非UTF8字符在Perl
- 12. 替換非UTF8字符
- 13. 取代非utf8字符
- 14. 如何編寫一個vba代碼來刪除和替換UTF8-字符
- 15. 字符串UTF8編碼問題
- 16. UTF8編碼字符不上的NodeJS
- 17. UTF8編碼的特殊外國字符
- 18. C++字符串編碼UTF8/unicode的
- 19. Base64在SQL中編碼utf8字符串
- 20. UTF8字符編碼在Java中
- 21. Zend Framework轉義utf8編碼字符
- 22. 比較UTF8編碼的字符
- 23. 特殊字符PHP UTF8編碼問題
- 24. Base64和utf8 /國家字符編碼
- 25. php,trim utf8編碼字符串
- 26. 更改字符串編碼WIN1250爲utf8
- 27. Nginx的:UTF8編碼字符導致
- 28. Javascript字符串編碼Windows-1250到UTF8
- 29. asp.net字符編碼問題utf8
- 30. 刪除非ASCII字符
Yur問題非常不清楚。如果一個字符串是Unicode,那麼根據定義,該字符串中包含的所有字符都是Unicode字符。 –
@Michael在UTF-8的情況下不是真的。 http://en.wikipedia.org/wiki/UTF-8#Invalid_byte_sequences –
@Pekka,那不是一個Unicode字符串。雖然我可能會誤解,並且OP沒有Unicode字符串開頭。 –