grapheme

4熱度

1回答

一般斯威夫特是真的智能計數字形集羣作爲一個單一的字符。如果我想打一個黎巴嫩國旗，例如，我可以將兩者結合起來的Unicode字符 U + 1F1F1區域指標符號字母L U + 1F1E7區域指標符號字母B 並預期這是斯威夫特一個字符： let s = "\u{1f1f1}\u{1f1e7}" assert(s.characters.count == 1) assert(s.utf16.count

2熱度

1回答

給定一個Unicode代碼點列表，如何將它們拆分爲一個Unicode字符列表？

我正在爲Unicode文本編寫一個詞法分析器。許多Unicode字符需要多個代碼點（即使在規範組合之後）。例如，tuple(map(ord, unicodedata.normalize('NFC', 'ā́')))評估爲(257, 769)。我怎麼知道兩個角色之間的界限？另外，我想存儲文本的非標準化版本。我的輸入保證是Unicode。到目前爲止，這是我所： from unicodedata im

1熱度

4回答

分割Unicode的實體由字形

"d̪".chars.to_a 給我 ["d"," ̪"] 如何獲得紅寶石由字形分割呢？ ["d̪"]

0熱度

1回答

字形š始終是大膽的

我與小時以來的字體風格戰鬥。我使用谷歌webfont的「open sans」，並測試了Google上的Google字形審查選項。一切都很好，š像其他字體一樣薄而美麗。（抱歉，我不能張貼圖像）但在我的網站š總是大膽！我重新設計了所有樣式表以確保沒有任何內容覆蓋字體重量或其他內容。我的文檔是utf-8，我試圖左右逢源發佈字形：S和š 我掃描谷歌quellcode找到魔正確顯示字形

3熱度

1回答

如何計算字形集羣或「知覺」在Java中

表情符我期待計數中，提供的Java字符串察覺的表情符號字符數。我目前使用的emoji4j庫，但它並不適用於字形集羣像這樣的工作：調用EmojiUtil.getLength("‍‍‍")回報4代替1，同樣叫EmojiUtil.getLength("‍‍‍")回報5代替2。是否有在Java中，可以很容易計算字形集羣上String任何API或方法？我一直在四處打獵，但是可以理解的是String上的

1熱度

1回答

一組不同的字形是無限的嗎？

可以使用Unicode編碼（如UTF-8）表示的不同字形的數量是否有限制？例如，Unicode標準是否限制連續組合字符的數量？

4熱度

3回答

在JavaScript字符串中獲取字符字符數？

我試圖在用戶可見的字形中獲取JavaScript字符串的長度，即忽略組合字符（和代理對？）。這是否可能，如果是的話，我會怎麼做呢？我們在我們的項目中使用dojo工具包，但任何一般的javascript解決方案都會很棒。