2017-07-18 23 views
0

我有一個字符串,在記事本中顯示時++寫着:如何替換一個只有unicode表示的字符?

App.xEFxBFxBF35 

的tocken EFxBFxBF接縫是,某些應用程序不能處理(對我來說它的紅移)一些UTF實體。

在記事本中的字符串作爲

App.35 

讀取如何從C#中的字符串中刪除這個實體?

EDIT

在Visual Studio中字符串顯示在調試器作爲

"App.\uffff35" 

EDIT 1

在最後事實證明,有它的大小所需要的柱一倍時我插入了非拉丁字符。

我通過查看sql server中列的字符長度創建了紅移表,並直接在紅移列中使用該數字。那是用拉丁字符的語言,但不用非拉丁字符。我發現這個紅移查詢的長度不同。

select bit_length('M'); 
select bit_length('Б'); 
select bit_length('Ö'); 

還給8,16,16

+0

http://www.fileformat.info/info/unicode/char/ef/index.htm和http://www.fileformat.info/info/unicode/char/bf/index.htm可能是有意義的。 – mjwills

+0

你在Redshift中使用什麼數據類型?您應該使用'VARCHAR'而不是'CHAR' - 請參閱http://docs.aws.amazon.com/redshift/latest/dg/multi-byte-character-load-errors.html。 – mjwills

+0

我正在使用這個版本的redhshift,並在它上面有varchar PostgreSQL 8.0.2在i686-pc-linux-gnu上,由GCC gcc(GCC)編譯3.4.2 20041017(Red Hat 3.4.2-6.fc3),Redshift 1.0.1385 –

回答

1

你有兩大選擇:

+0

剝離字符\ uffff做了訣竅 –

相關問題