0
我有很多很大的JSON文件,我想運行一些分析。我剛剛開始使用SparkSQL,並試圖確保理解從文件(並具有推測的模式)或run a SparkSQL query on the files directly中獲取SparkSQL read the JSON records into an RDD/DataFrame的好處。如果你有任何使用SParkSQL的經驗,我會很樂意聽到哪種方法是首選的,爲什麼。SparkSQL:直接讀取JSON或對文件執行查詢?
預先感謝您的時間和幫助!