2014-04-01 75 views
3

嗯,我想做一個PDF閱讀器,將文本轉換爲語音,我爲.txt文件做了這個,但我很困惑如何將PDF文件轉換爲TXT文件。如何將PDF轉換爲android應用程序中的文本?

一些pdf文件被掃描副本如何爲他們做?

+1

你無法讀取圖像。首先,你必須將它們轉換爲文本。爲此,您需要一個OCR軟件,它利用AI(人工智能)技術...您確定要將自己置身於此嗎?! –

+0

好的,留下一段時間的掃描副本,那麼正常的pdf呢。 –

+1

這裏有第三方庫 - 像[muPdf](http://mupdf.com/docs/how-to-build-mupdf-for-android),只是引用了一個 –

回答

2

要做到這一點,你必須使用的東西,認識到在代碼中的文本,根據維基百科:

光學字符識別
光學字符識別,通常縮寫爲OCR,是 機械或者將打印或打印文本的掃描或拍攝圖像 電子轉換爲機器編碼/計算機可讀 文本。它被廣泛用作從某種 原始數據源,無論是護照文件,發票,銀行 聲明,收據,名片,郵件或任何數量的打印 記錄的數據輸入形式。它是數字化打印文本的一種常用方法,以便它們可以進行電子編輯,搜索,更緊湊地存儲, 在線顯示,並用於機器處理如機器 翻譯,文本到語音,關鍵數據提取和文本挖掘。 OCR 是模式識別,人工智能 和計算機視覺領域的研究。

一些參考:

  1. 有一些可用的教程:http://kurup87.blogspot.nl/2012/03/android-ocr-tutorial-image-to-text.html
  2. 示例應用程序:https://github.com/rmtheis/android-ocrhttps://github.com/GautamGupta/Simple-Android-OCR
  3. 阿比的http://ocrapiservice.com
  4. 圖書館http://www.abbyy.com/mobileocr/android/

如果你不能選擇要挑選什麼,這裏有很多可用的stackoverflow文章,只是谷歌「android ocr stackoverflow」

相關問題