我工作的一個項目,需要一個更簡單,更精確的OCR工具簡化OCR與不變的字體
我的情景:
- 週刊圖像都具有相同的結構
- 我有一個我需要從
- 需要從
- 我需要從文本中獲取文本的一個小區域字體總是相同的(這是我可以得到更準確的地方)
- 沒有其他選項的圖像,但平坦的光柵圖像
- 核心軟件是在C#中,所以CLI語言將是可取的。
- 的圖像是300個DPI所以是一個偉大的基地,從
我會用一個正常的OCR程序的工作,但我知道,如果沒有完美的結果,我可以得到更準確的結果,因爲它總是相同的字體。
那麼,什麼是一個好的方法?我不想從頭開始寫這麼多的工作,但我不想要一個經過預先訓練的過度廣義OCR工具。我想在這個字體上訓練它,這樣它會得到非常準確的結果。我也不想做特徵提取分離出的單詞和找到字母等行。
我與[MODI](http://msdn.microsoft.com/en-us/library/aa167607(v = office.11).aspx)有過不錯的運氣;它需要客戶端安裝Office,但是YMMV。另一種選擇是[Tessnet2](http:// www。pixel-technology.com/freeware/tessnet2/) – 2011-12-22 17:54:56
如果您正在創建圖像,爲什麼不使用條形碼。這比任何OCR更準確。 – 2011-12-22 20:04:41
如果我正在創建這些圖像,我不需要使用OCR來知道文本所說的內容。我只是在製作圖像之前保存它... – brandon 2011-12-22 20:08:12