astral-plane

    1熱度

    3回答

    對於基本多語言平面中的字符,我們可以使用'\ uxxxx'轉義它。例如,您可以使用/ [\ u4e00- \ u9fff] /來匹配一個普通的中文字符(0x4e00-0x9fff是CJK Unified Ideographs的範圍)。 但是對於超出基本多語言平面的字符,它們的代碼大於0xffff。所以你不能使用格式'\ uxxxx'來轉義它,因爲'\ u20000'表示字符'\ u2000'和字符

    4熱度

    2回答

    我有一個關於C#中的字符串和字符的問題。我發現C#中的一個字符串是一個Unicode字符串,而一個char需要2個字節。所以每個字符都是UTF-16編碼。這很好,但我也在維基百科上看過,有些字符在UTF-16中佔用4個字節。 我在做一個程序,可以讓你爲字母數字顯示畫字符。在程序中還有一個測試器,您可以在其中編寫一些字符串,然後將其繪製爲您看看它的外觀。 所以我應該如何處理字符串,用戶在哪裏寫入需要

    0熱度

    1回答

    我使用antlr語法和antlr Ruby Target解析PHP代碼。我必須解析的一個源文件實際上包含翻譯,其中一些大量使用Unicode字符。語法似乎掛在「輔助飛機」中的一個角色上,即U+10430。 由於Ruby antlr目標非常陳舊,並且不符合unicode(當然,Ruby當時不是),所以過去有類似的問題。我們不得不將RubyTarget.java的getMaxCharValue從0xF

    3熱度

    1回答

    我必須將大量字符轉換爲它們的Unicode代碼點等價物。我用下面的代碼來做到這一點的轉換: string sample = "b"; int utf32 = char.ConvertToUtf32(sample, 0); string codePoint = string.Format("{0:X}", utf32); 這適用於比較正常的人物,不過那時候我也喜歡這些ǎ在實際字符串是包含2

    5熱度

    2回答

    我知道你不能在Rebol 2中使用大於^(FF)的代碼點在字符串中轉義的脫字符號樣式,因爲它不知道任何有關Unicode的內容。因此,這不會產生什麼好東西,它看起來很亂: print {Q: What does a Zen master's {Cow} Say? A: "^(03BC)"!} 然而,代碼在雷博爾3,並打印出: Q: What does a Zen master's {Cow}

    0熱度

    2回答

    我試圖顯示一組撲克牌,其中有1F0A0到1F0DF範圍內的Unicode值。每當我嘗試在代碼中使用超過4個字符的字符時,我都會遇到錯誤。在這種情況下可以使用這些字符嗎?我正在使用Visual Studio 2012. char AceOfSpades ='\ u1F0A0';打字後立即給出錯誤「字符字面值太多的字符」這仍然顯示與Unicode或UTF8編碼。如果我嘗試像上面那樣顯示'\ u1F0A

    0熱度

    1回答

    我使用http://code.kwint.in/emoji/將unicode iOS表情符號字符轉換爲我的Rails應用程序中的圖像。 它在開發過程中工作正常,但是當爲生產預編譯資產時,unicode字符代碼已更改。 例如,它們從"😄"變爲""。 如何防止發生此更改,因爲它會中斷上面鏈接的emoji.js腳本?

    1熱度

    2回答

    不在基本多語言平面(BMP)中的Unicode字符(代碼點)可能由兩個字符組成代碼單元),稱爲代理對。 'ab'是兩個代碼單元和兩個代碼點。 (所以兩個字符和兩個字符。) 'a'是三個代碼單元和兩個代碼點。 (所以三個字符和兩個字符)。 我的代碼不需要使用舊版本的JavaScript。 ES6或任何最現代的。 如何訪問最後一個字符,而不管它是否是星體字符? 將字符串拆分爲「除最後一個字符以外的所有

    2熱度

    2回答

    unicode的範圍究竟有什麼預期的語義字符在正則表達式的範圍,如果範圍內的一個或兩個端點是BMP之外?我觀察到下面的輸入行爲在Python 2.7和3.5不同: import re bool(re.match(u"[\u1000-\U00021111]", "\u1234")) 在我2.7我得到False,在3.5我得到True。後者對我有意義。前者或許是代理對\ud844\udd11扯到

    6熱度

    2回答

    通常我只會用str[i]之類的東西。如果str = "☀️"? str[i]失敗。 for (x of str) console.log(x)也失敗。它打印出總共4個字符,即使字符串中只有2個表情符號。 什麼是迭代每個字符我可以看到一個字符串(和換行符,我猜),沒有別的? 理想的解決方案將返回一個2個字符的數組:2個表情符號,沒有別的。聲明的重複,以及我發現的一堆其他解決方案,不符合此標準。