我有一個文件列表的單詞,不是太不相似,這是我想導入到我的MSSQL數據庫;轉換爲ASCII字符VB.net ssis
Świętochłowice
Chełmiec
Wałcz
...
我想做一個基本的波蘭字符轉換爲ASCII,以便他們可以通過我的數據庫進行分析。 我正在使用SSIS導入數據,因此我正在使用vb.net腳本來改變導入前/之前的文本。
我試過了;
Public Overrides Sub Input0_ProcessInputRow(ByVal Row As Input0Buffer)
Row.unsanitised1.Replace("Ą", "A")
Row.unsanitised1.Replace("ą", "a")
Row.unsanitised1.Replace("Ć", "C")
Row.unsanitised1.Replace("ć", "c")
Row.unsanitised1.Replace("Ę", "E")
Row.unsanitised1.Replace("ę", "e")
Row.unsanitised1.Replace("Ł", "L")
Row.unsanitised1.Replace("ł", "l")
Row.unsanitised1.Replace("Ń", "N")
Row.unsanitised1.Replace("ń", "n")
Row.unsanitised1.Replace("Ó", "O")
Row.unsanitised1.Replace("ó", "o")
Row.unsanitised1.Replace("Ś", "S")
Row.unsanitised1.Replace("ś", "s")
Row.unsanitised1.Replace("Ź", "Z")
Row.unsanitised1.Replace("ź", "z")
Row.unsanitised1.Replace("Ż", "Z")
Row.unsanitised1.Replace("ż", "z")
Row.sanitised = Row.unsanitised
Row.sanitised1 = Row.unsanitised1
End Sub
但是,當文件被讀入時,字符不能正確讀取,它們會更像「Ĺ」,我做錯了什麼?我需要以unicode的形式閱讀嗎?
將文件和vbscript保存在代碼頁1200中以保留波蘭字符。
使用Unicode代碼頁65001 –
@sandeeprawat感謝unicode代碼頁65001似乎大部分工作。由於某種原因,即使在解析數據時,它也會錯過,它看起來與我完全相同。 – Intern87
我會建議用unicode嘗試你的想法。我有一個類似的問題(用輕微不同的字符進行替換),並且在檢查並替換unicode代碼而不是字符本身後它工作正常。 – Tyron78