2011-06-22 66 views
4

我們計劃部署Solr以搜索從常見CMS平臺發佈的多個網站。單核或多核Solr

每種語言都會有不同的網站,其他語言大多都有英文翻譯的內容。

搜索要求包括 - 關鍵字突出顯示,建議(「你的意思是?」),停用詞,分面。

我們正在評估使用單核vs多語言多核Solr選項。這裏推薦的方法是什麼?

回答

6

你需要多核,因爲你不能做詞幹和停用詞多語言數據庫在多個內核上。

英語中常用的停用詞是「by」和「is」,但這些詞在許多北歐語言中的意思是「城鎮」和「冰」。

如果您執行多核,每種語言都可以在自己的核心上使用自定義schema.xml來選擇正確的詞幹,停用詞和受保護的詞。但同一個JVM在同一臺服務器上運行它,所以你不會花費額外的錢用於某種特定語言的服務器。然後,如果一臺服務器的負載太大,您可以複製多核設置,並且所有索引均可從複本中受益。