我要根據他們在python.Before擴展寫它自己的文件類型我想檢查是否有可用於這一目的的任何Python包進行分類。按文件類型我的意思是分類爲例如。 Doc,ppt,pdf,tar,txt,iso等理想情況下,它將文件名作爲輸入並返回它的類型。我在linux上運行的Python:確定文件類型通過查看它的擴展
1
A
回答
2
你應該看看文檔元數據分析。我已經使用Apache Tika這是我的一些項目中的Java庫。你可以看一下這個問題Python-based document metadata parser?來看看如何使用它在Python
1
在Linux中,您可以使用'file'utillity來確定文件類型。所以,如果你願意,你可以使用它,並在你的腳本也:
import subprocess
subprocess.call(['file', 'yourfile'])
+1
命令「文件」使用libmagic庫,有一個「蟒魔法」模塊,它提供本地接口,並使用相同的邏輯。 – neutrinus
相關問題
- 1. WebStorm - 通過文件類型擴展限制查找用法
- 2. 檢查文件MIME類型匹配它的擴展名在PHP
- 3. 確定NumPy類型的擴展轉換
- 4. 通過擴展查找文件
- 5. 確保文件擴展名匹配C++中的文件類型
- 6. 通過htaccess擴展重定向文件
- 7. 查看擴展事件文件
- 8. 通過擴展獲取文件類型描述
- 9. 如何通過它的url找到文件的擴展名?
- 10. 確定缺少擴展名的圖像的文件擴展名
- 11. ColdFusion REGEX - 確定文件的擴展名
- 12. 如何確定文件的擴展名
- 13. Vim擴展(通過Python)?
- 14. 擴展類型定製類
- 15. 轉換模型,通過它來查看
- 16. 確定擴展名的文件沒有擴展名
- 17. 使用Chokidar查看特定擴展的文件
- 18. 清單,並通過它們的擴展
- 19. 擴展原型的定義文件
- 20. 如何從Java中的MIME類型確定合適的文件擴展名
- 21. 如何通過.NET Compact Framework確定.dll文件的CPU類型?
- 22. python內置類型的擴展方法!
- 23. 通過GCC的Win64 Python擴展
- 24. 如何通過文件類型查看數據使用情況?
- 25. 擴展擴展類型
- 26. 查看擴展CommonNavigator
- 27. 通過FileSavePicker提供具有相同擴展名的多個文件類型
- 28. 如何通過文件擴展名獲取多媒體類型的TCM URI
- 29. 在沒有MIME或擴展名的PHP中確定文件類型
- 30. 通過XML數據類型列查看
文件的擴展名無關和它的類型。 –
看看這個問題:http://stackoverflow.com/questions/43580/how-to-find-the-mime-type-of-a-file-in-python。你可以用'mimetypes'來擴展*,但是像'python-magic'(在第二個答案中提到的)可能更可靠。 – kwatford
不*沒有*(你希望他們是相關的),但它們絕對不是一回事。例如,您完全可以將'.jpg'的擴展名更改爲'.doc',但類型仍然是jpeg。 –