我看到SparkSession
沒有.parallelize()
方法,我們是否需要再次使用SparkContext
來創建RDD ?.如果是這樣,在單個程序中創建SparkSession
& SparkContext
是可取的?在Spark 2.0中使用SparkSession時的並行化()方法
10
A
回答
13
一旦你建立你的SparkSession,你可以接着取得與它創建的基本SparkContext:
我們認爲SparkSession已定義:
val spark : SparkSession = ???
你可以得到SparkContext現在:
val sc = spark.sparkContext
0
我需要導入spark implicits來創建datafarme,而不用調用parallelize。
import org.apache.spark.sql.SparkSession
val spark = SparkSession
.builder()
.appName("Spark SQL basic example")
.master("local")
// .config("spark.some.config.option", "some-value")
.getOrCreate()
import spark.implicits._
val df = Seq(
(1441637160, 10.0),
(1441637170, 20.0),
(1441637180, 30.0),
(1441637210, 40.0),
(1441637220, 10.0),
(1441637230, 0.0)).toDF("timestamp", "value")
df.printSchema()
相關問題
- 1. 使用SparkSession創建廣播變量? Spark 2.0
- 2. sparksession getorcreate方法運行
- 3. Spark to Flink並行化方法
- 4. Spark中的並行方法調用和傳入方法中的Spark會話的使用
- 5. SPARK N-grams&並行化不使用mapPartitions
- 6. 在Spark中使用HiveContext時的Spark初始化錯誤
- 7. 在斯卡拉設計並行化Spark應用程序的最佳方法
- 8. spark 2.0並行JobProgressListener失敗慘劇
- 9. Spark 2.0:通過GetOrCreate重新定義SparkSession params並且看不到WebUI中的更改
- 10. Spark - SparkSession應該只有一個嗎?
- 11. 無法在CDH 5.7.5中安裝Spark 2.0
- 12. 在.NET 2.0中使用擴展方法?
- 13. 並行化對象方法的調用
- 14. 並行化testng中的類和方法
- 15. python中的並行化方法
- 16. Rails中的並行化方法
- 17. OpenCV中聚類方法的並行化
- 18. 錯誤而使用SparkSession或sqlcontext
- 19. 無法在EMR 5.0上實例化SparkSession HUE
- 20. 在Spark 2中創建SparkSession之後是否創建了SparkEnv?
- 21. 使用SparkSession將Json行的數據集轉換爲Dataframe
- 22. 使用unix_timestamp方法在spark中創建時間戳
- 23. 在spark中並行bean類
- 24. 使用OpenMP進行並行化的方法?
- 25. 我在創建SparkSession時遇到IllegalArgumentException
- 26. 如何在scala中並行化spark中的for循環?
- 27. python腳本中spark-submit與SparkSession的區別?
- 28. 從SparkSession訪問HiveConf
- 29. 從SparkSession獲取JavaSparkContext
- 30. 並行化在pyspark中的Spark數據幀組