2013-11-02 124 views
-2

我想用Hadoop mapreduce處理受密碼保護的壓縮文件。我能夠使用ZipFileInputformat處理未受保護的zip文件。但它不支持密碼保護的拉鍊。 是否有任何Java庫提供流訪問密碼保護的zip文件或提取zip文件,如果我可以使其字節內容可用?提前致謝。使用Mapreduce處理受密碼保護的zip文件

+1

如果你採取問題的核心部分:http://stackoverflow.com/questions/166340/write-a-password-protected-zip-file-in-java。 (請刪除不需要的標籤。map reduce與zip-with-password有什麼關係?) – Jayan

+0

@Jayan,感謝您的鏈接。我之前已經提到它,大多數庫需要帶有zip文件路徑的文件對象。我認爲File對象不能用於mapreduce Context.I正在尋找可以工作的庫,如果我可以使InputStream或Zip的字節內容可用的話。 – InfamousCoconut

回答

0

假設你可以找到,可以讀取密碼保護的zip文件(see this blog文章時)的Java庫,你應該能夠修改當前ZipFileInputFormat使用這個庫,然後你只需要配置密碼通過配置選項爲每個zip文件(希望你沒有太多的文件,或所有的文件都使用相同的密碼保護)。

它應該很容易。嘗試一下,如果遇到問題,發佈另一個問題 - 或詢問輸入格式的作者(https://github.com/cotdp/com-cotdp-hadoop是我通過谷歌發現的ZipFileInputFormat的一種可能的實現方式)是否可以爲你推出更新

+0

我卡住的是我發現的大多數庫都需要用於提取內容的文件對象。我一直在尋找可以與InputStream或zip的字節內容一起工作的庫。 – InfamousCoconut

相關問題