2016-11-09 141 views
3

什麼是強類型API和Spark類型的非類型化API?Spark數據集 - 強類型

數據集如何與DataFrames相似/不相似?

+0

任何人都可以請回答這個問題。 –

+0

鏈接解釋了數據集和數據框之間的差異。 http://stackoverflow.com/questions/31508083/difference-between-dataframe-and-rdd-in-spark/39033308?noredirect=1#comment68807827_39033308 –

回答

2

Dataframe API是非類型化的API,因爲只有在運行時才能知道類型。數據集API是類型化的API,在編譯期間將知道類型。

df.select("device").where("signal > 10")  // using untyped APIs 
ds.filter(_.signal > 10).map(_.device)   // using typed APIs