安裝pdfminer.six在我cmd窗口,我輸入 pip install pdfminer.six
,它給了我這些錯誤。 Microsoft Windows [Version 10.0.15063]
(c) 2017 Microsoft Corporation. All rights reserved.
C:\Users\Eric Kim>pip install pdfminer.si
我在Python中使用pdfminer包將PDF轉換爲HTML,但它將撇號轉換爲特殊字符。例如: ‘This is a text between apostrophes’ 應該是: 'This is a text between apostrophes' 有什麼辦法,以特殊字符轉換回撇號或更改編碼或東西嗎?我不太熟悉字符編碼。也許我可以選擇轉換爲HTML的編碼?
我想從pdf文檔中的某些表中提取信息。 考慮輸入: Title 1
some text some text some text some text some text
some text some text some text some text some text
Table Title
| Col1 | Col2 | Col3 |
|---------------|------