2016-11-18 26 views
0

是否可以處理文檔中的大整數列表?具有大整數列表的Solr

查找將完全由完全匹配。大多數文件將有〜100個列表條目,其中一些將是〜1k和< 10,最多25k。

此外:大型列表的最佳模式是什麼?

我的想法是一個索引,而不是存儲,多值字段。類型可以是TrieLongField,其precisionStep =「0」。另一個想法是將數據作爲純文本存儲在單詞標記器中。

回答

1

我會用一個多值整數字段時,應得到良好的性能:

<fieldType name="int" class="solr.TrieIntField" 
     positionIncrementGap="0" 
     precisionStep="0" 
     omitNorms="true" 
     omitTermFreqAndPositions="true"   
     multiValued="true" stored="false" 
    /> 
+0

聽起來不錯,謝謝!如果solr的行爲與文檔中的這種字段有聯繫,您是否有經驗?即更多的內存使用或類似的影響。 – edlerd

+0

我改變了主意,如果以純文本格式存儲,特別是如果您有很多可能的整數值時,會丟失一些將int轉換爲字典鍵的性能。 :)我從來沒有做過你的建議,但SOLR應該工作得很好...這比實際搜索文本更容易:) –

相關問題