10

我正在使用Scanner掃描Java中的.txt文檔。然而,當我打開Eclipse中的.txt文件,我注意到有些字符不被認可,他們的東西,看起來像這樣代替:Eclipse字符編碼

這些字符甚至不會讓我掃描文件爲

while(scan.hasNext) 

自動返回false(如果這些字符不存在,那麼我可以掃描文檔就好了)。

那麼,如何讓Eclipse識別這些字符以便掃描?我無法手動刪除它們,因爲文檔非常大。 謝謝。

+0

這意味着該文件中包含非打印字符,或者你使用(可能是默認值)的字符集是不是該文件是什麼。 –

回答

15

您正在閱讀的文件必須包含UTF-8或其他編碼字符,並且當您嘗試在控制檯上打印它們時,您將得到一些字符爲''。這是因爲eclipse中默認的控制檯編碼不是UTF-8。您需要通過轉到運行配置 - >常用 - >編碼 - >從下拉列表中選擇UTF-8來設置它。檢查下面的截圖:

enter image description here

13

如果您需要更改字符編碼爲您的整個Eclipse工作空間,去窗口 - >首選項。 然後在General - > Workspace下,將'Text file encoding'更改爲適當的字符編碼(在本例中爲UTF-8)。

Eclipse Preferences - Changing Character Encoding