如何串保存:爪哇 - 讀字符串掃描儀給我奇怪的字符
<title="<html><center>TURN: Washington's Spies (TV Series 2014–) - IMDb</center></html>">
通過標題分析了一下後,只需使用一個簡單的分隔符報價即
useDelimiter("\"")
並使用
lineScanner.next()
,標題我得到的回覆是
TURN: Washington's Spies (TV Series 2014â€「) - IMDb
這就是我通過控制檯得到的結果,以及我在設置JLabel文本時看到的內容。我要的是
TURN: Washington's Spies (TV Series 2014–) - IMDb
如何避免這種情況?
請發表您的代碼。 –
您可能應該使用XML解析器從HTML字符串中進行復雜(甚至是中度複雜)的提取操作。 –
它看起來像你解析它在錯誤的字符集 - 我會*猜*像它被保存爲UTF-8,並加載它爲ISO-8859-1。請顯示您如何創建'lineScanner'。 –