1
對於一個項目,我需要向mappers提供幾個配置文件,但它們包含在不同的文件夾中。文件夾結構必須保留。Hadoop分佈式緩存可以包含文件夾還是僅包含文件?
可以在分佈式緩存中創建目錄樹,並在分佈式緩存中訪問該文件夾樹中特定位置的文件?
感謝,
對於一個項目,我需要向mappers提供幾個配置文件,但它們包含在不同的文件夾中。文件夾結構必須保留。Hadoop分佈式緩存可以包含文件夾還是僅包含文件?
可以在分佈式緩存中創建目錄樹,並在分佈式緩存中訪問該文件夾樹中特定位置的文件?
感謝,
看一看的API documentation。非常清楚你能做什麼或不能做什麼。您只需將文件添加到緩存中,不包含任何路徑。但是,您可以包含一個存檔,並且該存檔可以具有將在客戶端中重新創建的目錄結構。
編輯:添加了關於用戶案例的以下信息。
所有的mapper都會讀取所有的配置文件,還是隻讀取其中的一部分?如果是後者,那麼你應該考慮在HDFS中創建文件夾結構。如果不同的映射器正在讀取不同的文件,那麼使用分佈式緩存將不會有優勢。
非Java應用程序可以提取/訪問重新創建distr緩存中結構的數據嗎? –