2012-06-30 24 views
0

我擁有數百萬個全文文檔的SOLR索引。這工作得很好。到現在爲止還挺好。SOLR中的文件夾

用戶可以在文件夾或集合中組織這些文檔。我希望能夠將搜索限制到某個文件夾(或多個文件夾),而無需爲每個文件夾創建索引。不同的用途可以將文檔存儲在不同的文件夾中,它不僅僅是一個位置的標籤。

我打算通過添加一個多值字段來存儲文檔的文件夾(或集合)ID。

這是一種使用SOLR的「有效」方式,還是我錯過了一些東西?另外,我是否會遇到有關多值字段中項目數量的限制?另外任何直接支持集合的替代搜索引擎將不勝感激。

+1

添加一個「集」屬性每個文檔,包括該提交用戶搜索查詢 –

+0

感謝@馬克時,這幾乎是我在想什麼的。只是想確保我沒有錯過別的東西。 ;-) –

回答

1

擁有多值字符串給定文檔所屬目錄的絕對路徑字段。例如,文檔可能屬於documents/reports/fin/2012johns_stuff/to_read

一些疑問:

documents/reports/fin/2012 <-- belongs to a specific directory 
documents/reports/fin* <--any subdirectory of this directory 
+0

有趣的方法,但兩個不同的用戶可以有相同的文件夾名稱(如重要的)。我想我可以使用用戶名(user_a/important&user_b/important)創建一個文件夾樹... –

+0

是的,你顯然需要一種方法來**爲不同的用戶區分**。 – aitchnyu

1

目前還不清楚信息是否是每個用戶。如果您需要每個用戶的文件夾信息(也就是說,如果用戶A將文檔D設置在文件夾F中,則用戶B在文件夾F中查找文檔將無法找到它),那麼您需要存儲與用戶相關的一些信息太。

我會建議使用一些名爲user_A,user_B等的動態字段,並在appropiate用戶字段中設置文件夾信息。

編輯:好的,那麼馬克的回覆是好的。只記得在fq中使用'collection',所以它被緩存並在其他查詢中重用。

+0

這些文件夾將被公開。任何用戶都可以搜索任何文件夾中的任何文檔。 –

相關問題