掃描圖像爲可讀文本

我想知道有沒有辦法通過編寫代碼將文本掃描圖像轉換爲可讀文本？那可能嗎？掃描圖像爲可讀文本

2010-10-11 AAA

Google OCR ..... – 2010-10-11 03:37:16

Java？ PHP？哪一個？都？ ...我喜歡[OCRopus]（http://code.google.com/p/ocropus/），因爲它是由goog製作的！ – 2010-10-11 03:41:19

@Tony和@matt我想自定義編寫它來實現我的項目。 – AAA 2010-10-11 03:44:25

OCRTools是我使用的.NET

對於Java，我已經在過去使用Aspire，這是非常好的，有點嚇人，但。我聽說過很多關於tesseract，你不妨檢查一下。

如果您對答案感到困惑：您正在尋找的是光學字符識別軟件的API/SDK。您在問題中提出的要求是從頭開始構建OCR。這需要理解圖像處理（主要是對象識別）。

2010-10-11 03:48:01 lalli

對Aspire有什麼可怕感到好奇。你能分享嗎？ – 2010-10-11 06:37:25

其實我從一次批量掃描Tiff圖像。讀它們本身是非常混亂的，我不得不使用另一個庫（ImageMagick或其他）來轉換它們，然後必須通過命中和試用來轉換圖像的小部分，並去除噪音和所有....但是那是版本1.something，現在是第4版... – lalli 2010-10-12 03:41:37

回答