multibyte

    0熱度

    1回答

    我不知道如何添加多字節編碼支持,並且對多字節語言知之甚少。 正在使用搜索引擎,我的應用程序使用所有編程語言掃描代碼。 某些源代碼可能在其註釋部分使用CJK編碼。 爲了方便起見,我將java作爲源代碼示例,我的應用程序也在java中。 首先,我想編寫測試用例來查看待索引的源代碼是否具有CJK編碼,以及它是否由我的應用程序編碼。 如果支持不包含,我希望我的測試失敗,以便將來可以添加。 但是我不知道如何

    1熱度

    2回答

    我正在使用MultiByteToWideChar將UTF-8編碼流轉換爲寬字符。當有一個不完整的字符和轉換結束緩衝區時,這個函數用'?'替換它。標誌。 我應該執行哪些檢查/設置來檢測不完整的字符,以便將它們添加到下一個緩衝區中?

    2熱度

    1回答

    我有一個C++項目,在2008年編譯得很好,在2010年它不會編譯。 在2010年,如果我將字符集更改爲多字節,它將進行編譯,但沒有字符串正常工作可以準確描述發生了什麼,如果我不改變它,下面的代碼錯誤和警告顯示。 2008年,它編譯並沒有一個單一的問題,工作得很好。 我不是在C++中非常明亮所以如果可能的話很容易理解的響應儘可能詳細,將有助於我很明白是怎麼回事,並加以修正。 這裏有錯誤和警告時,它

    2熱度

    1回答

    所以我有一個運行在UDP上的自定義二進制協議。 我的源碼是一個小端的嵌入式設備,發送基本上是發送(打包結構)。我的目標設備絕大多數都是小端PC。 我收到了一個更改爲網絡字節順序的請求。我的即時迴應是「不是一個機會」。我沒有看到任何點和翻轉我的100多個字段中的每一個,2到8個字節的整數以及浮動和雙打的組合,然後使大多數用戶都轉右並全部翻轉,並處理雙方所有的小編碼錯誤。 我錯過了什麼嗎?網絡字節順序

    0熱度

    2回答

    我需要釋放從這些函數中獲得的字符串嗎?或者系統可能會跟蹤它們。 GetCommandLine()也是同樣的問題。

    2熱度

    4回答

    我必須說im新的win32 c + +編程,所以我面臨一個問題, 一些代碼編譯多字節字符集,而不是Unicode字符集。 我的代碼如何同時支持? 例如此NOT編譯在多字節只有在Unicode和註釋向量僅在多字節: //vector<char> str2(FullPathToExe.begin(), FullPathToExe.end()); vector<wchar_t> str2(FullPa

    3熱度

    1回答

    我想用null替換這些字符[^ a-zа-з0-9_],但是當它的多字節字符串時我不能這樣做。 我試過用mb_ *,iconv,PCRE,mb_eregi_replace和u修飾符(用於PCRE),但都沒有效果。 的mb_eregi_replace工作,但只輸出正確的UTF8字符串,但它並不能取代的人物,當preg_replace函數使用相同的正則表達式工程.. 這裏是我的代碼與Unicode的作

    1熱度

    3回答

    我有一個字段從UTF-8頁刮: "O’Reilly" ,並保存在一個YML文件: :name: "O\xE2\x80\x99Reilly" (xE2x80x99是correct UTF-8 representation of this apostrophe) 然而,當我值加載到一個哈希,它屈服於標記爲UTF-8的頁面時,我得到: OâReilly 我查了字符â,它以UTF-16編碼爲x

    1熱度

    1回答

    我不確定這是否是正確的地方問這個,但我不知道任何其他網站會更好。這個問題與編程有關,所以: 我正在寫一個格式化的txt指南。請看看這段摘錄:http://mad-gaksha.homelinux.net/public/width.txt。我需要顯示全角字符,以便它們佔用半角字符的兩倍空間。雖然等寬字體似乎只用半角字符正常工作,但我嘗試過的大多數全寬「固定寬度」字體沒有產生所需的結果。 在firef

    18熱度

    5回答

    我想要得到的字節是std::string的字符串佔用的內存,而不是字符數。該字符串包含一個多字節字符串。 std::string::size()會爲我做這個嗎? 編輯:另外,size()也包括終止NULL?