2011-09-01 30 views
0

每當我複製並粘貼到以下任一提到字符文本框中轉換爲垃圾字符 - 當複製在文本框中粘貼

下面複製字符(在記事本中測試這一點)
...

'

下面是輸入的字符
...

'

然後將其轉換爲垃圾角色。我怎樣才能阻止這一點。 當我從keybord鍵入那些字符,然後它的作品,但複製粘貼它轉換爲垃圾。

如何檢測和刪除處理之前,這一切的性格,因爲..user不知道這個問題..

我想刪除字符文用戶按下提交按鈕。

回答

2

不是垃圾字符。它們是非常好的Unicode字符(U + 201C左側雙引號和U + 2018左側單引號)。現代應用程序應該能夠處理所有Unicode字符;如果你不能處理這些明智的引號,你可能無法處理希臘語,希臘語,西里爾文,中文或任何其他角色用戶可能想要使用的口音。您應該專注於確保您的應用程序支持Unicode,而不是試圖解決這一個可見症狀。

粘貼到文本框中的'"(ASCII直引用)字符不應將它們轉換爲非ASCII'智能'引號。它們通常傾向於來自Microsoft Word的誤導性'AutoReplace'功能,該功能可在您輸入時用直接引號替換智能引號。這是一個煩惱,但最終它僅限於Office,並且你無法對此做任何事情。雖然你可以手動取代"通過做一個簡單的字符串替換(和你如何做,這取決於你在說什麼語言/環境),你也將刪除正確的使用這些字符,你將不會修復MS Office所做的所有其他傷心的自動更換。

單字符省略號是一個稍微不同的情況,可以說是'垃圾':對於Unicode,U + 2026 HORIZONTAL ELLIPSIS是一個'兼容性字符',它只是用於很好地往返於現有的編碼,包括它作爲一個單獨的字符。通常應該使用三個點字符。您可以使用Unicode規範化替換兼容性字符,特別是Normal Form KC。同樣,你如何訪問規範化取決於你的編程語言/環境。例如在Python中,unicodedata.normalize('NFKC', u'…')給你u'...'

相關問題