2017-10-11 48 views
-1

我希望能夠以編程方式將這些字符插入剪貼板。他們每個人都是單個UTF-8角色嗎?如果不是,他們在什麼編碼? 我正在查看雖然UTF-8字符表http://www.utf8-chartable.de/unicode-utf8-table.pl拉丁字母,但無法找到它們。這些都是單個UTF-8字符嗎?

你在你的問題掛

一個 一個 一個 一個 一個 ü ü ü ü ü Ø Ø Ø Ë Ë Ë

+0

是的,它們都有單獨的Unicode代碼點,從U + 1EA4開始。 – deceze

回答

0

字符表只覆蓋Unicode的Basic Latin(U + 0000..U + 007F)和Latin-1 Supplement(U + 0080..U + 00FF)塊中的碼點。您顯示的每個字符都是Unicode的Latin Extended Additional塊(U + 1E00..U + 1EFF)中的碼點。當以UTF-8編碼的,這些字符佔用每3個字節,內容如下:

= U + 1EA4 = E1 BA A4

= U + 1EA6 = E1 BA A6

= U + 1EA8 = E1 BA A8

= U + 1EAA = E1 BA AA

= U + 1EAC = E1 BA AC

= U + 1EE8 = E1 BB A8

= U + 1EEA = E1 BB AA

= U + 1EEC = E1 BB AC

= U + 1EEE = E1 BB AE

= U + 1EF0 = E1 BB B0

= U + 1EE0 = E1 BB A0

= U + 1EE2 = E1 BB A2

= U + 1EDE = E1 BB 9E

= U + 1EC0 = E1 BB 80

= U + 1EC2 = E1 BB 82

= U + 1EC4 = E1 BB 84

根據您的平臺上,你可能會或可能無法儲存UTF-8在剪貼板上。例如,在Windows上,只能將文本存儲爲ANSI或UTF-16(除非您創建自定義剪貼板格式來保存UTF-8)。