1
A
回答
0
(1)你得到的,當你有
str.inspect
顯示? (2)如果你知道,你的字符串允許的字符範圍是什麼,你可以反過來替換任何不在這個範圍內的字符。
2
字符「 」是U+FFFD REPLACEMENT CHARACTER
in Unicode。如果字符串字面包含的字符,然後刪除它是那樣簡單:
cleaned_string = str.gsub "�", ''
或(假設你想避免在您鍵入代碼字符「」):
cleaned_string = str.gsub "\ufffd", ''
維基說這個關於這個字符:
它被用來表示系統無法將數據流渲染到正確的符號時的問題。
所以很可能你真正的問題是你沒有正確處理這個字符串的來源 - 很可能這是一個編碼問題。例如,如果字符串最初是abcé
,但是採用ISO-8859-1編碼,但某些系統將其解釋爲UTF-8,那麼最終字符é
將無效,該系統可能會將其顯示爲「 」 ,這是你的程序看到的。 (維基百科頁面有另一個例子。)
如果這是一個編碼問題,那麼根據這些數據來自何處可能爲時過晚對於你做任何事情,真正的數據可能已經丟失,最好的你可以做的是去掉這些字符(或者你可能更願意留下它們來指出哪裏出現問題)。否則,在將數據讀入程序時需要小心,將其讀取爲適當的編碼,以免數據丟失。
如果字符編碼對您來說完全是新的,那麼開始瞭解它們的好地方是Joel Spolsky的文章The Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets (No Excuses!)。
相關問題
- 1. 如何從字符串中刪除垃圾字符AES128解密
- 2. Phpbb垃圾郵件刪除
- 3. 如何從字符串中刪除這些符號(垃圾)?
- 4. 如何從字符串中刪除垃圾數據
- 5. 如何從XML文件中刪除隱形垃圾字符
- 6. 如何從javaee-api-7中排除垃圾郵件和ws等垃圾郵件?
- 7. 如何刪除Joomla/mysql中的垃圾郵件用戶
- 8. 從字符串或字符串數組中刪除多餘的垃圾字
- 9. 從傳入字符串中刪除所有垃圾的例程?
- 10. 文本刪除垃圾郵件URL
- 11. 從爆炸字符串中刪除垃圾信息
- 12. 從Ruby中的字符串中刪除電子郵件地址
- 13. 垃圾郵件與垃圾郵件
- 14. Python - 在字符串中檢測(垃圾郵件)URLS
- 15. 從JSON中刪除垃圾?
- 16. 垃圾郵件檢查,垃圾郵件得分如何?
- 17. 從XML文件中刪除垃圾字符(可能是BOM) - VBA
- 18. 垃圾郵件
- 19. 如何在WordPress中刪除垃圾郵件中添加的私人頁面
- 20. 從文件中刪除垃圾
- 21. 如何刪除文件中的垃圾字符數據看起來像這樣
- 22. Ruby - 刪除字符串中的短字
- 23. 如何從Ruby字符串中刪除字符串「\ n」?
- 24. 郵件中垃圾郵件文件夾
- 25. 垃圾郵件友好郵件如何?
- 26. C中的垃圾字符
- 27. Webview中的垃圾字符
- 28. Marshal.PtrToStringAnsi中的垃圾字符
- 29. 從Gmail垃圾郵件過濾器中刪除網站
- 30. 從MySQL數據庫表中刪除垃圾郵件
好吧,天知道... – apneadiving 2014-09-10 10:00:18
不知道紅寶石,你可以嘗試用空的替換所有''[^ \ x00- \ x7F]'嗎?它達到了你的目標嗎? – Kent 2014-09-10 10:00:29
@apneadiving連上帝都不知道,這就是他爲什麼要問這裏的原因。 :-) – Kent 2014-09-10 10:01:33