2016-10-21 291 views

回答

6

阿帕奇星火2.0.0的API都停留在很大程度上類似於1.X,星火 2.0 0.0確實有API的重大更改

阿帕奇星火2.0.0是2.x版本的首次發佈。主要更新爲API可用性,SQL 2003支持,性能改進,結構化流媒體,R UDF支持以及運營改進。在火花2

新:

  • ,我可以看到的是,DataSet和數據幀的API將被合併的最大的變化。
  • 與前輩相比,來自Spark的最新和最好的將是一個很大的效率。 Spark 2.0將專注於Parquet和緩存的組合,以實現更好的吞吐量。
  • 結構化流媒體是另一件大事!
  • 這將是第一個專注於ETL的版本。後續版本將增加更多的運營商和庫ETL

你可以通過Spark release 2.0.0凡在以下幾點更新說明:星火SQL

  • MLlib
    • API穩定性
    • 核心和
    • SparkR
    • Streaming
    • 依賴性,包裝和運營
    • 減除,行爲變化和棄用
    • 已知問題
    4

    沒有相對於太大的差別,以架構作爲簡而言之仍然是DAG和RDD,這是最它的重要組成部分!

    雖然Spark 2.0更加優化,並且具有DataSet Api,它可以爲開發人員提供更強大的功能。 所以我會說這個架構是一樣的,它只是Spark 2.0提供了很多優化,並且有一套豐富的Api!

    這些被Apache提供的主要的事情星火2.0:

    • ,我可以看到的最大變化是,DataSet和數據幀的API 將被合併。
    • 從Spark的最新和最好的將是一個整體 很多與前輩相比效率。 Spark 2.0正在將 重點放在Parquet和緩存的組合上,以實現更好的吞吐量。
    • 結構化流媒體是另一件大事!
    • 這將是 第一個版本,將重點關注ETL。後續版本將增加更多的運營商和庫ETL

    欲瞭解更多信息,請採取這裏樂:https://www.quora.com/What-are-special-features-and-advantages-of-Apache-Spark-2-0-over-earlier-versions