0
我正在將BigQuery中的數據讀入到dataproc spark集羣中。如果我的BigQuery表中的數據最初是從GCS加載的,那麼最好是從GCS直接讀取數據到Spark集羣,因爲dataproc的BigQuery連接器(newAPIHadoopRDD)首先將數據下載到Google Cloud Storage存儲桶中?這兩種方法之間有什麼優點和缺點?將BigQuery和/或雲存儲GCS中的數據讀入Dataproc