是否可以使用python熊貓打開PDF並閱讀它,還是必須使用此功能的pandas剪貼板?打開pdf並使用python熊貓閱讀表格
4
A
回答
2
這是不可能的。 PDF是用於打印的數據格式。表結構因此丟失。有些運氣可以用pypdf來提取文本,並猜測前面的表格列。
1
如果是一次性的,可以將PDF表中的數據複製到文本文件中,格式化(使用搜索替換,Notepad ++宏,腳本),將其保存爲CSV文件並將其加載到Pandas中。
如果您需要以可伸縮的方式執行此操作,您可以嘗試此產品:http://tabula.technology/。我還沒有使用它,所以我不知道它的工作效果如何,但是如果你需要它,你可以探索它。
0
從PDF中複製表格數據並粘貼到Excel文件中(通常將其粘貼爲單列而非多列)。然後使用FlashFill(在Excel 2016中提供,不確定早期的Excel版本)將數據分成最初在PDF中查看的列。該過程快速而簡單。然後使用Pandas來調整Excel數據。
相關問題
- 1. 如何閱讀使用python熊貓的表格格式的pdf文件?
- 2. 使用熊貓閱讀html文件,Python
- 3. 如何打開PDF並閱讀它?
- 4. 閱讀在熊貓
- 5. 打開源PDF閱讀器
- 6. 熊貓閱讀格式爲excel
- 7. 使用熊貓閱讀用於Python分析的JSON文件
- 8. 熊貓閱讀.csv文件
- 9. 熊貓閱讀從dataframe.to_string
- 10. 閱讀與大熊貓
- 11. 熊貓閱讀嵌套JSON
- 12. 如何從熊貓閱讀HDF表?
- 13. C# - 使用帶有PDF閱讀器中打開的PDF
- 14. 熊貓:與合併單元格的Excel閱讀
- 15. 如何使用熊貓閱讀Python中的文本文件
- 16. 如何閱讀使用Python熊貓的json文件?
- 17. 閱讀csv文件python 3.6使用熊貓
- 18. 閱讀使用熊貓和python數據的重複塊
- 19. 從Adwords下載數據並使用熊貓閱讀文件
- 20. 打開並閱讀2GB csv
- 21. 打開並閱讀在ASP
- 22. 打開外部PDF閱讀器
- 23. 使用python熊貓讀取.reg文件
- 24. 讀取Excel表用熊貓
- 25. 使用Python閱讀pdf內容
- 26. 用Python閱讀JSON文件的調試熊貓
- 27. 打開包裝列表爲大熊貓
- 28. 大熊貓讀取ASCII格式的表
- 29. 在android中使用iText閱讀或打開PDF文件
- 30. Phonegap使用默認閱讀器(IOS和Android)打開pdf
如何使用'pd.read_clipboard()'並手動複製它?桌子會工作嗎?我只是不喜歡手動輸入pdf中的所有內容 – ccsv
@ccsv:誰填寫剪貼板?這個程序有猜測表的結構,與 – Daniel
相同的問題!我希望能以pdf格式快速閱讀表格。 – ccsv