2012-02-25 32 views

回答

1

在大多數Linux發行版中,您應該有pdftohtml。顧名思義,它可以將PDF轉換爲HTML。 HTML轉換爲純文本可以通過多種方式來實現,例如使用lynx -dump file.html

+0

謝謝。但是,如果文檔禁用了文本的複製,該工具不能複製文本...我想要在語音閱讀器中閱讀的文檔非常長。 – user1141649 2012-02-25 15:38:11

1

您可以在Linux上使用pdftotext命令(的poppler一部分)。

+0

謝謝。但是,如果文檔禁用了文本應對或者包含密碼,該工具就不能複製文本? – user1141649 2012-02-25 15:36:30

+0

我不知道,我沒有用textcopy-disabled pdf來試用它。你試過了嗎? – uzsolt 2012-02-26 07:24:45

1

如果目標是使用鼠標從PDF中抓取文本,則應運行xpdf。它似乎沒有注意到安全設置。至少,我在我的Mac上運行的版本沒有。