2013-03-11 23 views
3

我想使用Solr作爲發佈的Tridion內容的客戶端搜索引擎。它可能會作爲與主應用程序斷開連接的RESTful服務完成。使用Solr與'樣板'DD4T

由於我們幾乎可以肯定會使用樣板文件DD4T,其中所有內容都發布給Broker,所以在索引PDF或Word文件等二進制文件時尤其如此 - 聽起來像是可能會對DB產生很大的壓力?

推薦使用什麼策略來檢索二進制文件並以這種方式編制索引?這聽起來似乎比我們在數據庫外部有二進制項目更困難?

+1

您好,您是否加入了Tridion Stack Exchange站點的私人測試版? http://tridion.stackexchange.com它看起來像你有一個area51帳戶 – 2013-03-11 14:41:54

+1

好主意。我認爲這是另一個領域DD4T很有幫助 - 您可以輕鬆將您的DD4T內容字段映射到Solr字段XML,並且您的自定義部署者,存儲擴展甚至事件系統可以將XML推送到Solr。 – robrtc 2013-03-11 14:51:23

回答

4

我們已經公佈的二進制文件到文件系統的決定 - 你只是像這樣配置這cd_storage_conf.xml:

<Publication Id="9" defaultStorageId="defaultdb" cached="true"> 
    <Item typeMapping="Binary" storageId="defaultFile" cached="true"/> 
</Publication> 

但是,即使你選擇發佈二進制文件到數據庫,這不應該影響你的Solr索引,它將完全獨立於代理數據庫。您需要編寫一些自定義(Custom Deployer?),將數據推送到您的Solr索引中,並且您可以選擇忽略二進制文件。

+0

感謝羅布,只是爲了清楚你是否用一個單獨的過程索引你的二進制文件?例如,客戶擁有大量需要索引的PDF文件。我認爲你可以設置某種類型的文件系統觀察器,它可以查找指定類型的二進制文件並觸發索引器? – mpaton 2013-03-11 15:33:08

+1

@mpaton是的,這就是我說你可以做的 - 我還沒有用DD4T做過(還沒有)。無論如何,只要將我的答案建立在沒有Tridion的情況下即可實現。有幾篇關於在StackOverflow和Web上索引PDF的文章:http://stackoverflow.com/questions/6694327/indexing-pdf-with-solr – 2013-03-11 17:55:38