2016-02-12 74 views
1

我運行查詢,並希望評估性能(執行IME) 我的嘗試:績效評估

t0 = time.time() 
df =sqlContext.sql(query) 
df.count() 
t1 = time.time() 

我可以肯定的是,查詢完成,T1-T0是查詢運行時間?

+0

鑑於這段特定的代碼?不可以。有些數據可以從緩存中獲取,它不能解釋依賴關係(可以緩存,從零開始載入),並且包括與客戶端的通信。 Spark UI可能是一個更好的檢查地點。 – zero323

回答

1

在IBM Analytics for Apache Spark上,在您的筆記本中,轉到「調色板」並選擇「環境」。在那裏你可以看到一個指向Spark History Server的鏈接,你可以在其中調查你的Spark工作。

對於每個Spark作業列出計算時間。