官方指導分佈式存儲說:爲星火
如果使用本地文件系統的路徑,文件也必須在 工作器節點上相同的路徑訪問。將文件複製到 所有工作人員或使用網絡安裝的共享文件系統。
Spark是否需要某種分佈式文件系統來進行隨機播放?或者我可以複製所有節點上的輸入,而不用打擾NFS,HDFS等?
官方指導分佈式存儲說:爲星火
如果使用本地文件系統的路徑,文件也必須在 工作器節點上相同的路徑訪問。將文件複製到 所有工作人員或使用網絡安裝的共享文件系統。
Spark是否需要某種分佈式文件系統來進行隨機播放?或者我可以複製所有節點上的輸入,而不用打擾NFS,HDFS等?
如果您可以將所有數據複製到所有節點上,爲什麼您需要Spark?在一臺計算機上本地處理數據可能會更快更輕鬆。只是一個建議。 – kostya