對於大型項目,我們擁有一些大規模的SOLR索引,並且其消耗的空間超過50 GB。SOLR索引尺寸縮減
我們已經考慮了幾種方法來減小與改變索引中內容相關的大小,但是我很好奇是否可能會對SOLR索引做出任何更改,從而減小其大小2個數量級或更多,它們與我們可以運行的(1)維護命令或(2)可能沒有正確設置的簡單配置參數直接相關。
另一個相關的問題是(3)是否有一種方法可以在SOLR內部交易性能指數大小,如果是,它將如何工作?
對此的任何想法將不勝感激...謝謝!
對於大型項目,我們擁有一些大規模的SOLR索引,並且其消耗的空間超過50 GB。SOLR索引尺寸縮減
我們已經考慮了幾種方法來減小與改變索引中內容相關的大小,但是我很好奇是否可能會對SOLR索引做出任何更改,從而減小其大小2個數量級或更多,它們與我們可以運行的(1)維護命令或(2)可能沒有正確設置的簡單配置參數直接相關。
另一個相關的問題是(3)是否有一種方法可以在SOLR內部交易性能指數大小,如果是,它將如何工作?
對此的任何想法將不勝感激...謝謝!
有幾件事情你可以通過交易指數來衡量指數的大小。例如,整數(int)字段使用的空間少於trie整數(tint),但使用int時範圍查詢會更慢。
要大幅度降低您的指數,您幾乎肯定需要更仔細地查看您正在使用的字段。
謝謝 - 這些「數量級」差異中的任何一個?從它的外觀來看,它們似乎只能以小百分比改變事物......我們需要大幅度減少(而且我們沒有像大型文本索引那樣做任何事情......大部分領域都很小......但我們只是有很多)。 – jayunit100 2012-04-10 04:01:17
省略規範和職位可以節省很多空間,尤其是索引的大小。看看這篇文章:http://css.dzone.com/news/solr-index-size-analysis – 2012-04-10 04:15:39
+1我還要補充一點,術語向量使用大量的空間,如果你有很多段,然後進行一些合併可以幫助段之間共享數據 – jpountz 2012-04-10 07:55:38
如果您可以發佈'schema.xml'和一些示例文檔,它將會有所幫助。 – nikhil500 2012-04-10 01:57:00