好吧,我是完全陌生的SOLR和Lucene,但已經得到了Solr的運行外的開箱Tomcat下6.x和剛剛走了過來一些基本的維基條目。將SOLR用於Web項目的最佳方法是什麼?
我有幾個問題,並要求一些建議了。
Solr可以索引文件(XML,CSV)中的數據,也可以索引數據庫。你也可以只是指向一個URI /域名,並以谷歌的方式索引一個網站?
如果我有一個網站用「的頁面」的數據,所以「頁面名稱」,「頁面內容」等,以及「產品的數據」,所以「產品名稱」,「SKU」等等,我需要兩個不同Schema.xml文件?如果是這樣,這是否意味着兩個不同的Solr實例?
最後,如果你有一個大的關係和規範化的數據庫的一個項目,你會說什麼是最好的方法從下面?:
3個選項在運行的中間件服務的背景下,其礦山DB和手動創建相關的XML文件,然後發送給SOLR
有無SOLR索引數據庫直接。在這種情況下,最好是將SOLR指向視圖,這將抽象所有表關係?
任何其他的選擇,我不知道的?
語境:我們在Windows 2003環境中運行,.NET 3.5,SQLServer的2005/2008
喝彩!
+1感謝Mauricio,這真的很有用。我想知道你是否可以在一點上擴大一點,可能是兩點。就陳舊和新鮮的數據而言,我使用哪些數據源並不重要?只有我多久提交更改......假設所有提交(添加/更新/刪除)都必須手動完成?至於SolrNet,我不需要擔心與SOLR手動通信嗎?再次感謝關於數據新鮮度的 – andy 2009-11-10 02:27:05
:它取決於數據的*用戶*(消費者)。如果消費者需要*總是*查看最新的數據以排除離線/後臺索引方法,並且您必須使用更具響應性的內容,例如觸發器或ORM攔截。 當然,索引網頁時你沒有得到任何「觸發器」,你唯一的選擇就是爬蟲。 是的,SolrNet處理.Net <-> Solr通信。 – 2009-11-10 02:55:42
@mauricio:謝謝你。我們使用自定義CMS來構建我們的網站。那麼,當您在CMS中編輯頁面/產品時,是否認爲只需通過XML提交更新/刪除到Solr就可以做出明智的決定?我們也不使用NHybernate,所以我認爲SolrNet沒有任何好處。再次感謝,這真的很有幫助 – andy 2009-11-10 03:01:28