2015-06-11 28 views

回答

10

首先,我應該透露我是Lucidworks Fusion的產品經理。

您似乎已經意識到Fusion可以與Solr(或一個或多個Solr集羣或實例)協同工作,使用Solr進行數據存儲和查詢。 Fusion的目的是使Solr更易於使用,集成Solr並構建使用Solr的複雜解決方案。 Fusion提供的一些東西包括:

  • 連接器和連接器框架。 Bare Solr爲您提供了一個良好的API,並能夠在命令行上推送某些類型的文件。 Fusion帶有幾個預先構建的數據源連接器,可從各種類型的系統獲取數據,並根據需要處理它們(包括解析,轉換和字段映射),並將結果發送到Solr。這些連接器包括通用文檔存儲(雲和本地),關係數據庫,NoSQL數據存儲,HDFS,企業應用程序以及功能強大且可配置的網絡爬蟲。
  • 安全集成。 Solr沒有任何身份驗證或授權(儘管從本週的5.2版本開始,它具有可插入的API和用於身份驗證的Kerberos的基本實現)。 Fusion以安全版本封裝了Solr API。 Fusion具有與LDAP,Active Directory和Kerberos進行全面認證的完整集成。它還具有用於管理和配置Fusion和Solr的細粒度授權模型。而且,Fusion授權模型可以自動將來自LDAP/AD的組成員資格與來自Fusion Connectors數據源的訪問控制列表關聯,以便在運行搜索查詢時從源系統獲取鏡像的文檔級訪問控制。
  • 流水線處理模型。 Fusion提供具有模塊化階段(以API和GUI形式)的流水線模型,以便更輕鬆地定義和編輯數據和文檔的轉換。它類似於unix外殼管道。例如,在編制索引時,您可以在寫入Solr之前包含用於定義字段映射,計算新字段,彙總文檔,從其他來源提取數據等的階段。查詢時,可以做同樣的事情,同時轉換查詢,運行並返回其他分析結果,並應用安全性過濾。
  • 管理GUI。 Fusion有一個Web UI用於查看和配置上述(以及基礎Solr配置)。我們認爲這對於想要使用Solr的人來說很方便,但不要經常使用它來記住如何使用API​​,配置文件和命令行工具。基於搜索的複雜功能:使用上述管道模型,融合包括(並且易於使用)一些更豐富的搜索組件,包括:自然語言處理和實體提取模塊;實時信號驅動的相關性調整。我們打算在未來提供更多。
  • 分析處理:Fusion包含並集成了Apache Spark,用於對存儲在Solr中(或進入Solr的數據)進行深入分析。儘管Solr隱含地包含了某些數據分析功能,但這不是其主要目的。我們使用Apache Spark來驅動Fusion的信號提取和相關性調優,並期望公開API以便用戶可以輕鬆地在那裏運行其他處理。
  • 其他:許多有用的雜項功能,如:儀表板UI;基本搜索用戶界面和手動相關性調整;更容易監控;作業管理和調度;通過電子郵件集成實時提醒,等等。

以上很多內容當然可以在沒有Fusion的情況下針對Solr構建或編寫,但我們認爲提供這些類型的企業集成對許多人都有價值。

+0

因爲你是lucidworks融合的產品經理,我可以問你什麼時候融合實現solr 5嗎?當發生這種情況時,你會提供一個遷移工具嗎?感謝您的回答,祝您生活愉快。 – donthurtme

+0

當前版本的Fusion已經支持Solr 5.x,儘管它們不包含在內。您可以單獨下載安裝Solr 5.x並將Fusion指向它。 Fusion的下一個版本預計將包括Solr 5.x. – gkanapathy

+0

@gkanapathy是否可以將SolrInputDocument壓入Fusion? – Garytxo