2011-08-15 201 views
1

我想在我的solr中實現阿拉伯語搜索,我能夠索引文檔但無法搜索它們。當我通過ID參考文件我得到的文件,而不是當我用阿拉伯語詞的搜索,Solr阿拉伯語搜索

搜索URL

http://122.166.9.144:8080/solr/tw/select/?q=تأجير الاهلي 

搜索響應

<response> 
<lst name="responseHeader"> 
    <int name="status">0</int> 
    <int name="QTime">18</int> 
    <lst name="params"> 
     <str name="q">تأجÙر اÙاÙÙÙ</str> 
    </lst> 
</lst> 
<result name="response" numFound="0" start="0"/> 
</response> 

可能是什麼問題呢?

感謝,

羅希特

編輯請求/響應頭

Response Headers view source 
Server Apache-Coyote/1.1 
Content-Type application/xml;charset=UTF-8 
Transfer-Encoding chunked 
Date Mon, 15 Aug 2011 15:37:25 GMT 

Request Headers view source 
Host 122.166.9.144:8080 
User-Agent Mozilla/5.0 (Windows NT 6.0; rv:5.0) Gecko/20100101 Firefox/5.0 
Accept text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8 
Accept-Language en-us,en;q=0.5 
Accept-Encoding gzip, deflate 
Accept-Charset ISO-8859-1,utf-8;q=0.7,*;q=0.7 
Connection keep-alive 
+0

好點,謝謝:) – Tarek

回答

1

顯然,服務器無法使用正確的字符集在URL中的阿拉伯文字解碼。它看起來似乎有點像UTF-8,但認爲它是Latin-1。您是否嘗試過使用wiresharking對話來查看哪些URL字節被髮送到服務器?

+0

我已經更新了請求/響應標題.. q似乎很好。 – sesmic

+0

您顯示的內容不是網絡語法,也不包括網絡上傳輸的(希望百分比編碼的)請求URL。 –

+0

感謝Henning的建議..實際上編碼沒有在服務器級別(tomcat)上正確設置。 – sesmic