0
我有一個字符串,在記事本中顯示時++寫着:如何替換一個只有unicode表示的字符?
App.xEFxBFxBF35
的tocken EFxBFxBF接縫是,某些應用程序不能處理(對我來說它的紅移)一些UTF實體。
在記事本中的字符串作爲
App.35
讀取如何從C#中的字符串中刪除這個實體?
EDIT
在Visual Studio中字符串顯示在調試器作爲
"App.\uffff35"
EDIT 1
在最後事實證明,有它的大小所需要的柱一倍時我插入了非拉丁字符。
我通過查看sql server中列的字符長度創建了紅移表,並直接在紅移列中使用該數字。那是用拉丁字符的語言,但不用非拉丁字符。我發現這個紅移查詢的長度不同。
select bit_length('M');
select bit_length('Б');
select bit_length('Ö');
還給8,16,16
http://www.fileformat.info/info/unicode/char/ef/index.htm和http://www.fileformat.info/info/unicode/char/bf/index.htm可能是有意義的。 – mjwills
你在Redshift中使用什麼數據類型?您應該使用'VARCHAR'而不是'CHAR' - 請參閱http://docs.aws.amazon.com/redshift/latest/dg/multi-byte-character-load-errors.html。 – mjwills
我正在使用這個版本的redhshift,並在它上面有varchar PostgreSQL 8.0.2在i686-pc-linux-gnu上,由GCC gcc(GCC)編譯3.4.2 20041017(Red Hat 3.4.2-6.fc3),Redshift 1.0.1385 –