2013-11-22 61 views
0

正在踢輪胎的DSE SOLR實施。 下面是一個模式片段:如何獲取Datastax企業solr中的同義詞?

alan, al 
alberta, berta, bertie, al, albie, bert, berto, burt 
gregory, gre, greg, gregg, gregor, greig, grieg 

所以在Solr的分析頁面,該指數不擴大艾倫:

<!-- A text field that only splits on whitespace for lowercase matching of words --> 
<fieldType name="lowtokens" class="solr.TextField" positionIncrementGap="100"> 
    <analyzer> 
    <tokenizer class="solr.WhitespaceTokenizerFactory"/> 
    <filter class="solr.LowerCaseFilterFactory" /> 
    </analyzer> 
</fieldType> 
<!-- ind name individual name synonyms on first token only (firstname) --> 
<fieldType name="basename" class="solr.TextField"> 
    <analyzer type="index"> 
    <tokenizer class="solr.PatternTokenizerFactory" pattern="(^\S+)" group="1" /> 
    <filter class="solr.ASCIIFoldingFilterFactory"/> 
    <filter class="solr.LowerCaseFilterFactory" /> 
    <filter class="solr.SynonymFilterFactory" synonyms="synonym_ind.txt" ignoreCase="true" expand="true"/> 
    <filter class="solr.RemoveDuplicatesTokenFilterFactory"/> 
    </analyzer> 
    <analyzer type="query"> 
    <tokenizer class="solr.PatternTokenizerFactory" pattern="(^\S+)" group="1" /> 
    <filter class="solr.ASCIIFoldingFilterFactory"/> 
    <filter class="solr.LowerCaseFilterFactory" /> 
    </analyzer> 
</fieldType> 

,這裏是從同義詞文件中的某些行Alan和Al 與Greg等人相同

從solr中獲得它似乎裝好吧:

curl -X GET http://localhost:8983/solr/resource/search.cust/synonym_ind.txt 
synonym_ind.txt 

它只是返回名稱,而不是錯誤,雖然。 UNIX格式的文件爲38607字節。 幫助?任何人使用DSE SOLR?可惜Datastax關閉了他們的論壇...

回答

0
  • 你是如何上傳同義詞文件的?

  • 上傳同義詞文件後,您是否強制執行Solr核心重新加載?

curl "http://localhost:8983/solr/admin/cores?action=RELOAD&name="
  • 你上傳同義詞和索引文件之前重新加載Solr的核心,還是你強制DSE Solr的重新索引,因爲你的同義詞索引的時間?
curl "http://localhost:8983/solr/admin/cores?action=RELOAD&name=&reindex=true&deleteAll=true"
  • DataStax決定從一個專有的支持論壇切換到所以,理論上,以提供更好的支持。

祝你好運。

+0

我很欣賞這個迴應...這是事件的順序。 –

+0

此處:http://pastebin.com/jECBgkcj –