2017-06-14 62 views
0

我在編譯solr時遇到了問題。我們在兩臺不同的服務器上有「相同」的設置,但其中一臺能夠將文件編入索引而無需???字符,但測試服務器遇到問題。使用Solr和tomcat進行Java編碼

Exemples Solr的結果:
PROD服務器:

effet sur l’acquisition des connaissances »\n\n#12;#12;EFFET D’UNE SÉQUENCE 

測試服務器:

effet sur l’acquisition des connaissances »\n\n��EFFET D’UNE SÉQUENCE D’ENSEIGNEMENTS 

我有java的相同版本的兩臺服務器上運行:

java version "1.7.0_80" 
Java(TM) SE Runtime Environment (build 1.7.0_80-b15) 
Java HotSpot(TM) 64-Bit Server VM (build 24.80-b11, mixed mode) 

兩者都具有相同的Java選項:

JAVA_OPTS=" -Dfile.encoding=UTF-8 " 

這兩個solr都具有相同的Java屬性(在UI中)。

#12;意思?

問題在哪裏?

OS:

  • 的Ubuntu 14.04

軟件:

  • 的Tomcat 8.0.43
  • 的dSPACE 6.0
  • Solr的4.10.4

編輯:兩臺服務器上 輸出語言環境:

LANG=en_CA.utf8 
LANGUAGE=en_CA:en 
LC_CTYPE="en_CA.utf8" 
LC_NUMERIC="en_CA.utf8" 
LC_TIME="en_CA.utf8" 
LC_COLLATE="en_CA.utf8" 
LC_MONETARY="en_CA.utf8" 
LC_MESSAGES="en_CA.utf8" 
LC_PAPER="en_CA.utf8" 
LC_NAME="en_CA.utf8" 
LC_ADDRESS="en_CA.utf8" 
LC_TELEPHONE="en_CA.utf8" 
LC_MEASUREMENT="en_CA.utf8" 
LC_IDENTIFICATION="en_CA.utf8" 
LC_ALL= 

謝謝!

+0

兩臺服務器上的「locale」命令的輸出是什麼? –

+0

我忘了提及它,我將它添加到帖子中 –

回答

0

問題不在於編碼,而在於DSpace的工作方式。我不得不運行命令:

./dspace filter-media -f 

此命令將重新生成PDF文件中的.txt文件並重新索引文檔。所以每次我試圖用正確的編碼索引文檔時,它都沒有改變任何東西。