壓縮類型是否有從其內容可靠地檢測出文件的壓縮類型的快速方法(即,不從文件擴展名),使用Apache的百科全書壓縮 API?檢測通過Apache共享壓縮
使用阿帕奇提卡,可以做
Tika tika = new Tika();
String path = <the full path to the file examined, including the filename>;
FileInputStream fis = new FileInputStream(new File(path));
String type = tika.detect(fis);
和類型變量被填充有檢測MIME類型的文件內容(例如,文本/無格式,應用程序/壓縮等)。
理想情況下,我想避免在這個過程中涉及Tika,原因很多,包括Tika似乎錯誤地檢測爲AR文檔格式的文本/簡單格式,這是由Commons Compress生成的格式。
我建議你爲AR格式問題打開一個Tika bug,並且包含一個非常小的樣本用於單元測試的文件 – Gagravarr