在一些示例代碼中,SparkSession實例被設置爲singleton。 這是否意味着應該只有一個SparkSession實例? 如果有多個SparkSession會發生什麼?他們可以(SparkSessions)互相交流嗎?Spark - SparkSession應該只有一個嗎?
1
A
回答
2
每個JVM只能有一個SparkSession(和SparkContext)實例。您將無法創建多個會話實例。
1
SparkSession對象是一個Singleton,因此每個客戶端只有一個。
你可以自己打開一個SparkShell容易驗證這一點:
斯卡拉> spark.toString
res7:字符串= [email protected]
import org.apache.spark.sql.SparkSession
scala>:paste //輸入 粘貼模式(ctrl-D完成)
VAL火花= SparkSession .builder()
.appName( 「SparkSessionZipsExample」).getOrCreate()//退出粘貼模式,現在解釋。
17/02/06 07:25:48警告SparkSession $ Builder:使用現有的 SparkSession,某些配置可能無法生效。火花: org.apache.spark.sql.SparkSession = [email protected]
階>:糊//進入粘貼模式(CTRL-d來完成)
VAL spark = SparkSession .builder()
.appName(「SparkSessionZipsExample」).getOrCreate()//退出粘貼模式,現在解釋。
17/02/06 07:25:40警告SparkSession $ Builder:使用現有的 SparkSession,某些配置可能不會生效。火花: org.apache.spark.sql.SparkSession = [email protected]
正如你可以在這三種情況下,我們又回到了同一個對象@ d76a6bd
看相關問題
- 1. 每個應用程序應該只有一個EventSource對象嗎?
- 2. 應該只有一個組件擁有狀態嗎?
- 3. MVVM模式中應該只有一個ViewModel類嗎?
- 4. 即使只有一個塊,chunking.success.endpoint應該被調用嗎?
- 5. java包應該只有一個公共類嗎?
- 6. ProducerTemplate應該只有一個實例
- 7. 樹應該只有一個根節點
- 8. 我還應該創建一個類嗎?如果它只能有一個實例?
- 9. 應該只有一列的表有主鍵嗎?
- 10. pyspark error:AttributeError:'SparkSession'對象沒有屬性'parallelize'
- 11. 從SparkSession訪問HiveConf
- 12. 一個集合應該只包含不可變元素嗎?
- 13. 如果我只想要一個庫,應該在application_controller中嗎?
- 14. 從SparkSession獲取JavaSparkContext
- 15. 'SparkSession'對象沒有屬性'sparkContext'
- 16. MVVM:ViewModel應該有一個成員到另一個ViewModel嗎?
- 17. 我應該創建C++中只有一個函數的子類嗎?
- 18. RESTful控制器中的SHOW操作應該始終只有一個資源嗎?
- 19. 只有一個孩子的嵌套ExpandableListView應該一次可見
- 20. ui.bootstrap.collapse - 兩個崩潰 - 只有一個應該打開
- 21. 當只有一個人應該打開兩個窗口
- 22. 檢測到多個事件,其中應該只有一個
- 23. 兩個背景圖像,只有一個應該重複
- 24. 多個messageDialog的開放當只有一個應該
- 25. jquery應該只觸發一個事件
- 26. 爲什麼只有一個spark工作只使用一個執行器運行?
- 27. 什麼時候應該/不應該在Spark中序列化一個類?
- 28. 一個有用的寶石版本應該有版本1.0嗎?
- 29. 什麼應該是一個React組件,什麼應該只是一個HTML?
- 30. 我應該在每個視圖中都有一個NSFetchedResultsController嗎?
謝謝,它幫助我:) –