2012-01-18 30 views
1

我剛剛碰到一個奇怪的行爲JSoup庫1.3.3(相當古老,我知道)。Java JSoup庫element.text()返回' '作爲#160的ASCII字符

當解析文本節點,並且這conatins  實體是由該元件上調用的.text()來#160 ASCII字符轉換

你有沒有體驗過?你認爲這是一個正確的行爲? (選中Jsoup回購爲錯誤,沒有發現)

謝謝,

回答

3

非間斷空間一樣正常的空間。 Non-break space在ISO-8859- *,Windows-1252中爲0xA0或160十進制,Unicode中爲U + 00A0(UTF-8中編碼爲0xC2 0xA0)。因此,根據您的確切編碼,這是正確的行爲。

+0

感謝您的回答。 – jppalencar 2012-01-18 10:07:13

相關問題