我有一些文本文件包含一些非ASCII字符,我想刪除它們,但保留格式化字符。如何刪除虛假的非ASCII字符,但保留空格和換行符?
我試圖
$description = preg_replace('/[\x00-\x1F\x80-\xFF]/', '', $description);
然而這似乎剝離新行和其他格式化出並還與一些希伯來語的問題,其然後被轉換這個
משפטיםנוספיםמהמומחה。 נסוותהנו! חג חנוכהשמח ****************************************חדש - האפליקציההיחידהשאומרת關於 最新版本1.1 - 專家會議!!! *
這個
1.4: 「...... 」「 ...... 」「 50 ...」。 ,。 ! **************************************** - 版本1.1的新功能 - 專家會談!!! *
不,他不是要轉換的字符集。他試圖從UTF-8字符串中刪除ASCII範圍以外的字符。當然,你的解決方案是可行的,因爲ASCII是UTF-8的一個子集。使用ISO-8859-1,他會得到非ASCII字符,並且他不能再使用具有期望UTF-8功能的字符串。 – Artefacto 2010-08-23 17:17:03