2011-11-19 36 views
2

作爲標題,我不知道如何解析包含字母字符和來自其他語言的特殊字符的字符串C.任何人都請幫助我如何區分他們在C ?.我是否需要安裝一些可選組件來幫助C接受字符?(我在Linux環境中)。非常感謝您的回覆。在C/C++中解析包含字母字符和區域字符(法語,俄語,中文)的字符串

+0

有一些庫,但是你可能需要在繼續之前學習基本字符編碼,因爲你沒有似乎對這個概念很熟悉。 –

+0

什麼字符編碼? UTF-8? UTF-16? UCS-32? –

+0

實際上,我想使用UTF-8進行編碼,我想我需要在解決問題之前瞭解更多信息。非常感謝您的意見。不過,我真的很感激,如果任何人都可以給我一個示例代碼來做到這一點在C. – Zuhakasa

回答

1

您至少需要決定要使用還是支持的character encoding(s)。之後,您將需要決定是否將國際字符串保留爲原生形式,或者將它們使用libiconv之類的字符串轉換爲應用程序中的單個編碼。因此,首先,正如Laurent在評論中指出的那樣,您需要了解您正在嘗試做什麼(這不會很容易 - 公平的警告)。並且看看Joel Spolsky(Stack Overflow的聯合創始人)多年前寫了什麼:http://www.joelonsoftware.com/articles/Unicode.html

+0

非常感謝您的鏈接約翰。 – Zuhakasa

+0

如果他們讓你指出正確的方向,你可以考慮通過點擊左邊的複選標記來接受我的答案。 –