刪除所有空操作.bz2文件,我有一個文件夾(實際上HDFS上,但我不認爲這會影響這個問題)的操作.bz2文件。其中一些解壓縮時會給出單個空文件。我想刪除所有解壓縮爲空的.bz2文件,我注意到它們都具有14個字節的大小。簡單地刪除所有14個字節的文件是否安全?或者是否有可能將一個非空文件壓縮到/從一個14字節的bz2解壓縮?從文件夾
從文件夾
回答
BZ2是由BZIP 2. BZIP 2中使用的壓縮文件格式是Julian Seward寫創建一個開放和自由壓縮程序。 BZ2文件使用Burrows-Wheeler壓縮算法結合運行長度編碼(RLE)進行最大壓縮。 link
如果你想刪除這些文件,先用下面的代碼片斷。廣州文件的詳細信息。
解壓文件GZ2
gunzip -c test.bz2 | hadoop fs -put - /path/filepath
閱讀其內容
hadoop fs -text /path_for_hdfs/test.bz2 | hadoop fs -put /hdfs_path/abc.txt
我創建一個空的文本文件,並使用bzip2壓縮並插入到HDFS。 空的bzip2文件的大小是14B。 當我做與非空文件(只有一個字符)相同時它是39字節。
我的結論是,所有的bzip2 14B文件將是空的。
使自己desition根據測試用例...
但是,任何人都可以解釋爲什麼一個14字節的bz2文件會一直解壓縮到一個空文件?即您的答案似乎基於歸納推理,但是在潛在的數據丟失問題上,我會因爲基於演繹推理的答案而感到更安全。 – tex94
「爲什麼一個14字節的bz2文件總是會解壓到一個空文件。」 使用bzip2壓縮的空文件將爲14B。 但我不知道14B大小的確切原因 – Rahul
我接受,但可能由於某種原因,非空文件也會壓縮到14個字節?僅僅說明一個字符壓縮到14個字節是不夠的,因爲壓縮算法很容易被假設爲壓縮說8,16或32個字符的副本比單個字符的空間要小。我希望有一個具有bz2領域特定知識的人可以提供答案...... – tex94
- 1. 從文件夾
- 2. 從文件夾
- 3. 從文件夾
- 4. 從文件夾引用到文件夾
- 5. 將文件夾從文件夾複製到文件夾python
- 6. Makefile文件 - 從文件夾
- 7. 文件夾從文件
- 8. 從exluding文件夾
- 9. PHP /從文件夾
- 10. 將文件從子文件夾移動到父文件夾中
- 11. 從文件夾和子文件夾中刪除文件
- 12. 如何將文件從子文件夾移動到文件夾
- 13. 將文件從tmp文件夾移動到永久文件夾
- 14. javac從文件夾A編譯文件到文件夾B(linux)
- 15. 將文件從源文件夾複製到目標文件夾
- 16. 從public_html文件夾內編輯public_html文件夾外的文件
- 17. 將文件從文件夾移動到文件夾
- 18. 從CSV文件中的文件夾批空子文件夾
- 19. 將文件從子文件夾移動到一個文件夾
- 20. 從文件夾內的文件夾讀取文件
- 21. 將文件夾從一個文件夾複製到一個新文件夾
- 22. iphone將文件夾從文件夾複製到文檔
- 23. 閱讀從文件夾的子文件夾和所有組件
- 24. 文件夾或文件夾
- 25. 從文件夾打印文件
- 26. 從URL文件夾獲取文件名
- 27. 從虛擬文件夾檢索文件
- 28. 文件無法從文件夾下載
- 29. 從文件夾獲取文件名
- 30. 從文件夾中刪除文件
我真的不希望有,雖然解壓縮所有文件...問題是,我可以保證一個14字節BZ2是空的? – tex94