我將PDF格式的Marathi數據轉換爲excel或單詞,但它沒有得到正確的格式。 我已經從PDF複製了一些數據並粘貼在word文檔中,但它沒有得到正確的格式。 例如這個行在PDF ,但是當我複製並粘貼在word中時,它已經得到 -供稿瞭解更多信息 該怎麼辦? 任何人都請幫助我。如何將pdf格式的marathi數據轉換爲excel格式
感謝您提前
我將PDF格式的Marathi數據轉換爲excel或單詞,但它沒有得到正確的格式。 我已經從PDF複製了一些數據並粘貼在word文檔中,但它沒有得到正確的格式。 例如這個行在PDF ,但是當我複製並粘貼在word中時,它已經得到 -供稿瞭解更多信息 該怎麼辦? 任何人都請幫助我。如何將pdf格式的marathi數據轉換爲excel格式
感謝您提前
檢查您的PDF中的字體,並嘗試使其可用於word文檔。
我想你沒有這是在PDF
用在Adobe Reader perticular字體 - - 文件菜單>屬性>字體選項卡讓你在文檔中使用的所有字體列表。
我已經試過這個,但是沒有得到結果 –
在adobe閱讀器中打開文檔,右鍵點擊它,然後點擊文檔屬性,點擊字體標籤。它將顯示該文檔上使用的所有字體。 –
PDF存儲unicode devnagri文本的方式似乎存在問題。嘗試這種替代路線:將您的PDF轉換爲圖像。在終端可以使用在線工具或下載,或者在Linux上使用這個命令:
for f in *.pdf; do convert -density 200 "$f" "${f}_200dpi.jpg"; done
變化的密度從200到其它按需要。文檔中的每個頁面都應該轉換爲圖像文件。對於windows工具,試試https://www.pdfill.com/pdf_tools_free.html
然後,轉到http://www.i2ocr.com/free-online-hindi-ocr,上傳圖片並轉換。這使用OCR(光學字符識別)。
我已經試過這個但是沒有得到結果 –