unicode

    0熱度

    1回答

    服務器爲Unicode:使用unixODBC的 我用在與數據的列DB2數據庫中的表的Linux:IBM i系列AS/400上運行DB2 客戶端CCSID 836(簡體中文EBCDIC)。我想用UTF-16獲得結果,以便在其他系統上工作,但我很難找到正確的轉換方式。 當我嘗試: SELECT CAST(MYCOLNAME AS VARCHAR(100) CCSID 13491) FROM MY.TA

    1熱度

    1回答

    我對此知之甚少,想尋求幫助。我使用的語言是C#。 我有2個字,其被編碼爲UTF-8 CSV文件: TĂ´̀‰ng Tổng 我創建了一個測試Windows窗體2個文本框,並且增加了以下事件: private void textBox3_TextChanged(object sender, EventArgs e) { byte[] decodeutf = Encoding

    3熱度

    1回答

    這裏開一個Unicode路徑是我的代碼: local path = "C:/Users/KayWang/Desktop/測試.txt" local file,err = io.open(path,"rb") print(file,err) ,這是輸出: nil C:/Users/KayWang/Desktop/測試.txt: No such file or directory 我不想使

    1熱度

    1回答

    我試圖閱讀使用python ftfy庫混合編碼類型的文本。該庫提供良好的結果時文本不混合即 >>> print(ftfy.fix_text('ünicode')) ünicode 但如果文字是混合然後得到這樣的事情即 >>> print(ftfy.fix_text('Hi to ℙℽ☂ℌϕℿ ünicode')) ℙℽ☂ℌϕℿ ünicode 這東西,這個庫不能處理?有什麼

    0熱度

    2回答

    我在數據框中有一列「名稱」。 我要刪除所有的行,它的名字並不在names_all: names_all = ['alice', 'bob', 'david'] 所有在names_all字符串和數據幀是unicode字符串。 我寫的代碼: for index, row in history.iterrows(): if row['name'] not in names_all:

    2熱度

    2回答

    我做了一個Mastodon/Twitter < - > IRC機器人。它工作得很好,但有人抱怨說,當人們在乳齒象上使用emojis時(這在某些用戶名中似乎發生了很多..)它打破了他的終端。 我想知道是否有一種方法將它們發送到IRC之前卸下這些從字節串(或至少提供一個選項,這樣做),谷歌上搜索了一下,我發現這一點:removing emojis from a string in Python 貌似\

    2熱度

    1回答

    有問題的功能: PIL.ImageDraw.Draw.text(xy, text, fill=None, font=None, anchor=None) 的問題是非常標準的...廢話 現在,我運行一個字符串(UTF-8)成平局上面的文字功能,但它給所有那些怪異的字符。但是,如果我只是打印它,它顯示的字符很好。 我應該傳遞的Unicode對象呢?

    0熱度

    1回答

    我對utf-8編碼的文本文件執行一系列正則表達式操作,其中包含一個包含字母和非字母字符,包括非拉丁字符帶有變音符號的字符。這是該文件的一個片段(注意非拉丁字符): oro[=]sia[=]łeś oszust[=]ką 我的腳本首先打開文本文件,讀取每一行,併除去不必要的字符。然後,我的正則表達式操作首先捕捉匹配指定模式的單詞,然後插入調整非字母字符組[=]的位置。這是我的腳本片段: # -

    4熱度

    1回答

    我的目標:給出的String任意UTF-16的位置,找到相應的String.Index表示Character(即延長字形集羣)指定的UTF-16代碼單元是其中的一部分。 例子: (I put the code in a Gist for easy copying and pasting.) 這是我的測試字符串: let str = "‍" (注:見字符串作爲單個字符,你需要在一個合理的閱讀最新

    1熱度

    1回答

    我將html數據(帶子彈樣式的數據)轉換爲java字符串,但我們在字符串中獲取了垃圾值(��--默認unicode值替換),我試圖使用replaceAll()刪除這些值,但它不工作。 任何建議,如何從字符串中刪除這些unicode字符?