ElasticSearch是一種搜索服務器,它只接受UTF8中的數據。從因特網獲得的文本的UTF8轉換
當我試圖給ElasticSearch以下文本
小企業可能在行較輕的報告負擔包括那些低於£44萬的年營業額,低於£220,000比減少淨資產十人」
通過我的Java應用程序 - 基本上我的Java應用程序需要從網頁此信息,並將其提供給elasticSearch ES抱怨它無法理解£和失敗下面的代碼過濾通過後 - 。
byte bytes[] = s.getBytes("ISO-8859-1");
s = new String(bytes, "UTF-8");
這裏£
轉化爲�
但是當我使用bash將其複製到文件中我的主目錄,並在去罰款。任何指針都會有幫助。
http://xkcd.com/138/ –
@VineethMohan( 「ISO-8859-1」)'?我以爲你需要使用UTF-8? – buruzaemon
我需要識別基本編碼。我假定文本的編碼爲ISO-8859-1 –