0
正在踢輪胎的DSE SOLR實施。 下面是一個模式片段:如何獲取Datastax企業solr中的同義詞?
alan, al
alberta, berta, bertie, al, albie, bert, berto, burt
gregory, gre, greg, gregg, gregor, greig, grieg
所以在Solr的分析頁面,該指數不擴大艾倫:
<!-- A text field that only splits on whitespace for lowercase matching of words -->
<fieldType name="lowtokens" class="solr.TextField" positionIncrementGap="100">
<analyzer>
<tokenizer class="solr.WhitespaceTokenizerFactory"/>
<filter class="solr.LowerCaseFilterFactory" />
</analyzer>
</fieldType>
<!-- ind name individual name synonyms on first token only (firstname) -->
<fieldType name="basename" class="solr.TextField">
<analyzer type="index">
<tokenizer class="solr.PatternTokenizerFactory" pattern="(^\S+)" group="1" />
<filter class="solr.ASCIIFoldingFilterFactory"/>
<filter class="solr.LowerCaseFilterFactory" />
<filter class="solr.SynonymFilterFactory" synonyms="synonym_ind.txt" ignoreCase="true" expand="true"/>
<filter class="solr.RemoveDuplicatesTokenFilterFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="solr.PatternTokenizerFactory" pattern="(^\S+)" group="1" />
<filter class="solr.ASCIIFoldingFilterFactory"/>
<filter class="solr.LowerCaseFilterFactory" />
</analyzer>
</fieldType>
,這裏是從同義詞文件中的某些行Alan和Al 與Greg等人相同
從solr中獲得它似乎裝好吧:
curl -X GET http://localhost:8983/solr/resource/search.cust/synonym_ind.txt
synonym_ind.txt
它只是返回名稱,而不是錯誤,雖然。 UNIX格式的文件爲38607字節。 幫助?任何人使用DSE SOLR?可惜Datastax關閉了他們的論壇...
我很欣賞這個迴應...這是事件的順序。 –
此處:http://pastebin.com/jECBgkcj –