2017-03-03 95 views
0

有人可以解釋SAP HANA的智能數據訪問SAP HANA Vora之間的區別嗎?SAP HANA智能數據訪問與SAP HANA Vora之間的差異

正如我understud的SDA只是產生了一些virtual tables,使訪問外部系統的數據(如Hadoop和其他許多數據庫通過ODBC)像它會是SAP HANA系統(這樣你就可以的一部分使用HANA IDE)並使用「默認數據庫引擎」來計算該外部系統的子結果並將其返回給SAP HANA。

Vora的概念也是爲SAP用戶提供對Hadoop系統的訪問,但是通過使用Apache Spark的InMemory執行引擎可以對子結果進行計算。

我讀到Hadoop是一個完美的冷數據存儲(來自SAP HANA的數據超過了特定的時間段並且不需要進行所有分析)。但是我對這兩種數據訪問解決方案感到困惑,因爲我找不到一個重要的區別。

如果您計劃在SAP HANA工具編寫的一次分析中訪問熱門(SAP HANA)和冷(Hadoop)數據,哪一個更好?

將SAP HANA與包含Hive表中數據的Hadoop集羣結合起來會有什麼建議?

回答

1

HANA Vora和SDA是相關的,但實際上是兩個不同的東西,不能直接比較。

智能數據訪問是在HANA功能/組件,用於連接到外部數據源(例如MySQL的/ Oracle數據庫,沃拉等)中的「HANA沃拉」

字HANA是誤導,因爲沃拉實際上是一個不需要HANA運行的獨立產品。 Vora是Apache Spark的擴展,允許您在內存中處理來自HDFS的數據。另外,Vora的主要特點之一是它與HANA很好地結合在一起。它可以將其本地表與HANA中的表連接起來,反之亦然。

當前,Vora不支持INSERT/UPDATE命令,因此您不能將數據直接從HANA移動到VANA。您可以通過使用本博客文章中討論的HANA數據生命週期管理器(DLM)來實現此目的:https://blogs.sap.com/2016/02/12/seamless-big-data-tiering-with-hana-hadoop-and-vora-with-a-little-help-from-dlm/

+0

謝謝您的澄清,非常有幫助! –