2010-10-11 38 views
1

我想知道有沒有辦法通過編寫代碼將文本掃描圖像轉換爲可讀文本?那可能嗎?掃描圖像爲可讀文本

+1

Google OCR ..... – 2010-10-11 03:37:16

+0

Java? PHP?哪一個?都? ...我喜歡[OCRopus](http://code.google.com/p/ocropus/),因爲它是由goog製作的! – 2010-10-11 03:41:19

+0

@Tony和@matt我想自定義編寫它來實現我的項目。 – AAA 2010-10-11 03:44:25

回答

4

OCRTools是我使用的.NET

對於Java,我已經在過去使用Aspire,這是非常好的,有點嚇人,但。我聽說過很多關於tesseract,你不妨檢查一下。

如果您對答案感到困惑:您正在尋找的是光學字符識別軟件的API/SDK。您在問題中提出的要求是從頭開始構建OCR。這需要理解圖像處理(主要是對象識別)。

+0

對Aspire有什麼可怕感到好奇。你能分享嗎? – 2010-10-11 06:37:25

+0

其實我從一次批量掃描Tiff圖像。讀它們本身是非常混亂的,我不得不使用另一個庫(ImageMagick或其他)來轉換它們,然後必須通過命中和試用來轉換圖像的小部分,並去除噪音和所有....但是那是版本1.something,現在是第4版... – lalli 2010-10-12 03:41:37