0
是否可以處理文檔中的大整數列表?具有大整數列表的Solr
查找將完全由完全匹配。大多數文件將有〜100個列表條目,其中一些將是〜1k和< 10,最多25k。
此外:大型列表的最佳模式是什麼?
我的想法是一個索引,而不是存儲,多值字段。類型可以是TrieLongField,其precisionStep =「0」。另一個想法是將數據作爲純文本存儲在單詞標記器中。
是否可以處理文檔中的大整數列表?具有大整數列表的Solr
查找將完全由完全匹配。大多數文件將有〜100個列表條目,其中一些將是〜1k和< 10,最多25k。
此外:大型列表的最佳模式是什麼?
我的想法是一個索引,而不是存儲,多值字段。類型可以是TrieLongField,其precisionStep =「0」。另一個想法是將數據作爲純文本存儲在單詞標記器中。
我會用一個多值整數字段時,應得到良好的性能:
<fieldType name="int" class="solr.TrieIntField"
positionIncrementGap="0"
precisionStep="0"
omitNorms="true"
omitTermFreqAndPositions="true"
multiValued="true" stored="false"
/>
聽起來不錯,謝謝!如果solr的行爲與文檔中的這種字段有聯繫,您是否有經驗?即更多的內存使用或類似的影響。 – edlerd
我改變了主意,如果以純文本格式存儲,特別是如果您有很多可能的整數值時,會丟失一些將int轉換爲字典鍵的性能。 :)我從來沒有做過你的建議,但SOLR應該工作得很好...這比實際搜索文本更容易:) –