1
我運行查詢,並希望評估性能(執行IME) 我的嘗試:績效評估
t0 = time.time()
df =sqlContext.sql(query)
df.count()
t1 = time.time()
我可以肯定的是,查詢完成,T1-T0是查詢運行時間?
我運行查詢,並希望評估性能(執行IME) 我的嘗試:績效評估
t0 = time.time()
df =sqlContext.sql(query)
df.count()
t1 = time.time()
我可以肯定的是,查詢完成,T1-T0是查詢運行時間?
在IBM Analytics for Apache Spark上,在您的筆記本中,轉到「調色板」並選擇「環境」。在那裏你可以看到一個指向Spark History Server的鏈接,你可以在其中調查你的Spark工作。
對於每個Spark作業列出計算時間。
鑑於這段特定的代碼?不可以。有些數據可以從緩存中獲取,它不能解釋依賴關係(可以緩存,從零開始載入),並且包括與客戶端的通信。 Spark UI可能是一個更好的檢查地點。 – zero323