我有阿拉伯文PDF文件,它的編碼似乎有錯誤。修復PDF編碼
當我嘗試在PDF對裏面的字進行搜索,但沒有發現結果
,當我嘗試將PDF內容導出到Excel中使用其他程序是在一個陌生的編碼數據導出
當我將PDF中的數據複製到記事本中時,記事本顯示奇怪的編碼。
我正在開發將使用這些PDF(約950文件)的解決方案,所以我必須找到一種方法來修復編碼。
在此先感謝
我有阿拉伯文PDF文件,它的編碼似乎有錯誤。修復PDF編碼
當我嘗試在PDF對裏面的字進行搜索,但沒有發現結果
,當我嘗試將PDF內容導出到Excel中使用其他程序是在一個陌生的編碼數據導出
當我將PDF中的數據複製到記事本中時,記事本顯示奇怪的編碼。
我正在開發將使用這些PDF(約950文件)的解決方案,所以我必須找到一種方法來修復編碼。
在此先感謝
聲明:我從來沒有編輯過阿拉伯文件。
你是如何將.pdf內容導出到Excel的?
您不能直接打開.pdf文件既不與Word/Excel中/寫字板也不記事本, 是奇怪編碼你看到的很可能是一個選擇的字體資源的特定編碼。
您可以使用此 this 工具來檢測編碼
但我真的建議你閱讀有關 Unicode and Character Sets
從此最低限度,考慮到文件的涉案金額,好解決方案似乎是 PyODConverter
對於少量的文件, Free PDF to Word Converter將照顧你的ne編者:
親愛的Joao,我的主要問題是修復PDF文件,當我在任何PDF閱讀器中打開它時,我可以很容易地閱讀它,但是當我搜索任何單詞時,我發現它告訴我「找不到結果」 –
但是,編碼這些.pdf正在使用?檢查這個問題,也許它會讓你跟蹤:http://superuser.com/questions/119393/search-pdfs-with-non-standard-character-encodings –
是的,這是確切的我的情況,謝謝 –
你能請分享一個鏈接到你的一個文件? – Bobrovsky