3
嗯,我想做一個PDF閱讀器,將文本轉換爲語音,我爲.txt文件做了這個,但我很困惑如何將PDF文件轉換爲TXT文件。如何將PDF轉換爲android應用程序中的文本?
一些pdf文件被掃描副本如何爲他們做?
嗯,我想做一個PDF閱讀器,將文本轉換爲語音,我爲.txt文件做了這個,但我很困惑如何將PDF文件轉換爲TXT文件。如何將PDF轉換爲android應用程序中的文本?
一些pdf文件被掃描副本如何爲他們做?
要做到這一點,你必須使用的東西,認識到在代碼中的文本,根據維基百科:
光學字符識別
光學字符識別,通常縮寫爲OCR,是 機械或者將打印或打印文本的掃描或拍攝圖像 電子轉換爲機器編碼/計算機可讀 文本。它被廣泛用作從某種 原始數據源,無論是護照文件,發票,銀行 聲明,收據,名片,郵件或任何數量的打印 記錄的數據輸入形式。它是數字化打印文本的一種常用方法,以便它們可以進行電子編輯,搜索,更緊湊地存儲, 在線顯示,並用於機器處理如機器 翻譯,文本到語音,關鍵數據提取和文本挖掘。 OCR 是模式識別,人工智能 和計算機視覺領域的研究。
一些參考:
如果你不能選擇要挑選什麼,這裏有很多可用的stackoverflow文章,只是谷歌「android ocr stackoverflow」
你無法讀取圖像。首先,你必須將它們轉換爲文本。爲此,您需要一個OCR軟件,它利用AI(人工智能)技術...您確定要將自己置身於此嗎?! –
好的,留下一段時間的掃描副本,那麼正常的pdf呢。 –
這裏有第三方庫 - 像[muPdf](http://mupdf.com/docs/how-to-build-mupdf-for-android),只是引用了一個 –