在我的應用程序的一個一個我們需要的索引海量數據(30GB),這是不可用在索引時間查詢數據。我們使用SOLR來索引這些數據。我們在schema.xml中有50個字段。我正在索引來自不同數據庫的數據。如何索引和使用Solr的
但在所有索引字段中的數據時不可用。所以我們創建了多個核心並分別對每個核心建立索引。
例如: - 採用酷睿0,我們使用的是單獨的查詢索引5場
選擇字段1,字段2,字段3,字段4,字段5從雙。
字段1 - 公共領域在覈 字段2場---這是在這個核心 索引字段3 - 現場這是在這個核心 索引字段4 - 現場這是在這個核心 索引字段5 - 這是在這個核心
索引,以便其餘全部領域CORE0場會比上述5場零等。
接着核心1
核心1,我們使用索引單獨的查詢3個字段
選擇字段1,字段6,字段6從雙。
字段1 ---在覈領域常見 字段6場---這是在這個核心 字段7索引 - 現場這是在這個核心
索引,我們使用的是常見的schema.xml中的所有核心。
用於查詢,我們寫了單獨查詢每個核心,然後合併結果的自定義請求處理程序。此外,每個核心中的數據將每3小時刷新一次。我曾嘗試局部更新功能在solr4.0,但它也需要花費很多時間來索引......不那麼有用
是他們的任何更好的方法/設計到處理器這個問題?
感謝, 拉維
你怎麼正好與「所有字段中的數據不可用在索引時間」是什麼意思?我真的可以幫助你,但我不完全明白你的問題... NB:更新你的文章,舉一些例子和更大的解釋,不要評論:) –