6
A
回答
6
阿帕奇星火2.0.0的API都停留在很大程度上類似於1.X,星火 2.0 0.0確實有API的重大更改
阿帕奇星火2.0.0是2.x版本的首次發佈。主要更新爲API可用性,SQL 2003支持,性能改進,結構化流媒體,R UDF支持以及運營改進。在火花2
新:
- ,我可以看到的是,DataSet和數據幀的API將被合併的最大的變化。
- 與前輩相比,來自Spark的最新和最好的將是一個很大的效率。 Spark 2.0將專注於Parquet和緩存的組合,以實現更好的吞吐量。
- 結構化流媒體是另一件大事!
- 這將是第一個專注於ETL的版本。後續版本將增加更多的運營商和庫ETL
你可以通過Spark release 2.0.0凡在以下幾點更新說明:星火SQL
- API穩定性
- 核心和
- SparkR
- Streaming
- 依賴性,包裝和運營
- 減除,行爲變化和棄用
- 已知問題
4
沒有相對於太大的差別,以架構作爲簡而言之仍然是DAG和RDD,這是最它的重要組成部分!
雖然Spark 2.0更加優化,並且具有DataSet Api,它可以爲開發人員提供更強大的功能。 所以我會說這個架構是一樣的,它只是Spark 2.0提供了很多優化,並且有一套豐富的Api!
這些被Apache提供的主要的事情星火2.0:
- ,我可以看到的最大變化是,DataSet和數據幀的API 將被合併。
- 從Spark的最新和最好的將是一個整體 很多與前輩相比效率。 Spark 2.0正在將 重點放在Parquet和緩存的組合上,以實現更好的吞吐量。
- 結構化流媒體是另一件大事!
- 這將是 第一個版本,將重點關注ETL。後續版本將增加更多的運營商和庫ETL
欲瞭解更多信息,請採取這裏樂:https://www.quora.com/What-are-special-features-and-advantages-of-Apache-Spark-2-0-over-earlier-versions
相關問題
- 1. Apache Spark vs Apache Ignite
- 2. Apache Phoenix vs Hive-Spark
- 3. Apache Spark與Apache Storm
- 4. Apache Spark SQL NumberFormatException
- 5. Apache Spark Worker Timeout
- 6. Apache Spark GraphX java.lang.ArrayIndexOutOfBoundsException
- 7. apache spark集羣
- 8. Apache Spark配置
- 9. Apache Spark mapPartitionsWithIndex
- 10. java apache spark mllib
- 11. apache spark實現
- 12. Apache Spark - java.lang.NoSuchMethodError:breeze.linalg.DenseVector
- 13. Apache Spark性能
- 14. Talend和Apache Spark?
- 15. Apache Spark FileNotFoundException
- 16. Apache Spark與python
- 17. Apache spark - java.lang.NoClassDefFoundError
- 18. apache spark Streaming error
- 19. 'where'in apache spark
- 20. 的Apache Sqoop和Spark
- 21. Apache Spark RDD拆分「|」
- 22. Scala vs Python中的Apache SPARK SVM
- 23. Apache Spark DataSet API:head(n:Int)vs take(n:Int)
- 24. java.lang.NoClassDefFoundError:org/apache/spark/deploy/SparkSubmit
- 25. Apache Spark Stderr和Stdout
- 26. Spark Apache源代碼
- 27. 加入流Apache Spark
- 28. Apache Spark的分區
- 29. java.lang.NoClassDefFoundError:org/apache/spark/sql/SchemaRDD
- 30. Apache SPARK與SQLContext :: IndexError