1
我不想知道它說了什麼,它不會處理像驗證碼一樣的任何失真,我只想知道圖像的一堆是否包含任何文本。
快速字符檢測
這是在一些空閒的Linux服務器上運行的東西,一個cron作業會每天處理大量的圖像。
我想在這個過程中要做的事情之一就是放棄任何帶有文本的圖像。我不介意一些誤報,但是當涉及識別應儘可能丟棄文本的圖像時,我希望能達到零失敗率。
我不想知道它說了什麼,它不會處理像驗證碼一樣的任何失真,我只想知道圖像的一堆是否包含任何文本。
快速字符檢測
這是在一些空閒的Linux服務器上運行的東西,一個cron作業會每天處理大量的圖像。
我想在這個過程中要做的事情之一就是放棄任何帶有文本的圖像。我不介意一些誤報,但是當涉及識別應儘可能丟棄文本的圖像時,我希望能達到零失敗率。
Tesseract-OCR是Google用於Google圖書的內容。試一試。
這似乎有點沉重,我想要做什麼,我可能會回來,但如果我找不到更輕。 :) – joebert 2009-07-04 05:23:14