0
一個編碼方案給出ã as a%CC%83
,另一個給出ã as %C3%a3
。對於相同的UTF-8字符,編碼結果不同
這兩個有什麼區別?我正在調試這個,發現a%CC%83
實際上是2個字符。一個用於~
這是%CC%83
和一個用於a
。但是,如何獲得該編碼?
一個編碼方案給出ã as a%CC%83
,另一個給出ã as %C3%a3
。對於相同的UTF-8字符,編碼結果不同
這兩個有什麼區別?我正在調試這個,發現a%CC%83
實際上是2個字符。一個用於~
這是%CC%83
和一個用於a
。但是,如何獲得該編碼?
這是正常的行爲。在Unicode中,相同的符號可以編碼爲單個字符或組成兩個或更多字符。
但是,組成一個不適合我們。如何禁用該功能。我只需要編碼爲'單個字符' –
@VivekVardhan,你使用什麼編程語言?您需要執行Unicode標準化來預編碼字符,但請注意,並非所有分解字符都具有預編碼字符。 –
我們正在以這種方式獲取來自Android應用的請求。並且對Lucene的查詢不會給出合成編碼的結果,但會給出正常編碼(單字符編碼)的正確結果,但是對於相同的ios發送單字符編碼值 –