2012-01-26 91 views
2

我正在使用HTMLUnit。我正在訪問頁面,但是特殊(馬耳他語)字符顯示錯誤。例如,ġuvni顯示爲?uvni顯示錯誤字符的HTML單元

HtmlPage page = submit_button.click(); 
System.out.println(page.asText()); 

我懷疑這是一個編碼的問題,雖然我沒有找到任何page.setPageEndoding或一些類似的方法......有沒有人收到這樣的問題?

謝謝!

回答

2

確保你的網頁是UTF-8通過把這個元標記在您的<head>

<meta http-equiv="Content-Type" content="text/html; charset=utf-8"> 
+0

嗯,當我得到它想出的「UTF-8」的頁面編碼。 –

+0

實際上發生的事情是Eclipse的控制檯輸出未設置爲「UTF-8」。一旦我改變它,角色顯示正常。控制檯編碼可以按如下所示進行更改:http://decoding.wordpress.com/2010/03/18/eclipse-how-to-change-the-console-output-encoding/ 10x! –