2016-01-23 108 views
-2

我想將英語翻譯成x語言,爲此 首先,將英文字符轉換爲等效的英文Unicode ,然後將英文Unicode轉換爲x Unicode ,然後將x轉換爲x字符。所以,我想將一種語言的Unicode轉換爲使用c語言或其他語言的其他語言的Unicode。是否可以將一種語言的unicode轉換爲其他語言的unicode?

例如,我要轉換的 「Linux」(EX字)從英語到泰米爾語 「லினக்ஸ்」

Unicode進行的 「Linux」(如字):004C 0069 006E 0075 0078

是他們將此英文Unicode轉換爲泰米爾等效Unicode的可能性?

+5

Unicode是Unicode。這個標準已經發展了多年,但所有的語言都使用相同的Unicode,這就是它的重點。在過去,IBM(例如)爲不同的語言設置了不同的字符集。 Unicode已經取代了所有這些。 – cdarke

+0

也許您正在考慮用多字節替換單字節字符(例如ASCII或ISO Latin 1)?在Python中,請參閱C中的'codecs'模塊,參見http://stackoverflow.com/questions/11576846/convert-ascii-string-to-unicode-windows-pure-c。如果您使用Python 3或Java或C#,則無論如何,本地字符串都是Unicode。 – cdarke

+0

目前還不清楚你想做什麼。你能舉一些例子輸入和輸出嗎? –

回答

2

您無法執行「將英文unicode轉換爲x語言unicode」這一步驟。 Unicode是一種編碼,每種語言中的每個字符都有唯一的編碼點,所以沒有什麼是「英文unicode」或「x語言unicode」 - 它是單一的編碼類型。即對於字母「i」有一個表示0x2A(不是一個真正的代碼點,只是爲了解釋),unicode中的0x2A將始終是「我」獨立於語言。

+2

原諒我,但0x002A是'*',或者這是對生命,宇宙和所有事物的無意識使用? – cdarke

+1

正如方括號0x2A中所述,「我不是真正的代碼點」與我的例子「我」。當然,由於unicode與ASCII兼容,因此0到128之間的任何數字都是合法的unicode代碼點。但是我明白了「42」的意思,是的,那是無意識的。 :) – Nikita

+1

我認爲在Unicode中0到255是ISO Latin 1 http://ftp.unicode.org/Public/MAPPINGS/ISO8859/8859-1.TXT是正確的。 0到** 127 **是ASCII,是的,這是令人難以置信的迂腐。 – cdarke

相關問題