我有根據pageIds(UniqueKey)索引的Lucene文件。一個文檔可以有多個頁面。現在,一旦用戶執行一些搜索,它會給我們提供符合搜索條件的頁面如何在Solrnet/Solr(Lucene)中實現分組?
我使用Lucene.Net 2.9.2
我們有2個問題...
1的文件大小爲800GB左右,它擁有130萬行(頁)所以搜索時間真的很慢(所有查詢花費的時間超過了一分鐘)(我們只需要一次返回有限的行)
爲了克服性能問題,我轉移到SOLR解決了性能問題(這很奇怪,因爲我沒有使用SOLR提供的任何額外的功能,比如分片等 - 所以Lucene.NET 2.9.2並不等同於性能比較器紅色到相同版本的JAVA ??)但現在我有另一個問題...
2-單個'lucene文檔'是一頁,但我想顯示結果''真實文檔'分組。我應該返回多少結果應該基於「真實文檔」而不是「頁面」進行配置(因爲我想向用戶展示這些內容)。
因此,我們可以說我想要20個'真實文檔'以及它們中與搜索條件相匹配的所有頁面(如果一個文檔有100頁而另一個文檔只有1個,則無關緊要)。
從我可以從SOLR論壇得到的是,它可以通過SOLR-236補丁(字段崩潰)來實現,但是我還沒有能夠正確地將補丁應用於trunk(提供很多錯誤)。
這對我來說真的很重要,我沒有太多時間,所以有人可以給我發送SOLR 1.4.1二進制文件,如果有任何其他方式,請使用此補丁或引導我。
我真的很感激它。謝謝!!
@ Mauricio Scheffer:實際上這是我們的要求,我們需要顯示查詢匹配的頁碼。 – 2010-08-12 15:03:54