2010-10-02 87 views
2

我在我的一個應用程序中使用了Tesseract,我無法獲得完美的結果。當我在完美的屏幕截圖上使用該庫時,它會獲取大部分文本,這很好。但是,當我在照片上使用它時,它在解決問題時遇到了麻煩,有時它甚至不會返回任何東西。iPhone上的Tesseract培訓

我知道你可以訓練Tesseract,有沒有一個很好的培訓教程或iPhone的照片識別?或者在處理它之前我應該​​對我的源圖像進行任何修改?

謝謝!

回答

2

發佈樣張圖片。這裏有一些事情要看:

你怎麼得到的圖像1位?最終OCR是在黑白圖像中完成的 - 也許你可以比圖書館做得更好。

什麼是圖像的DPI?掃描通常在200-300 DPI左右,但照片可以是72或96. OCR引擎會查看DPI以瞭解字母的大小。您可能需要更改DPI並對圖像進行重新採樣(調整大小),以使DPI符合預期。 OCR引擎期望掃描文檔,而不是照片。

+0

因此,如果我理解正確,我應該將圖像轉換爲大約200 dpi和黑白,以期望獲得更好的效果?有沒有一個好的圖書館在iPhone上做到這一點? – elliottbolzan 2010-10-02 01:57:17

+2

先手動操作,看看它是否有所作爲。你可以使用GIMP。如果更好,CoreImage是IOs庫的一部分。 B/W轉換必須以很好的方式完成 - 有幾種閾值算法 - 您可能需要使用它。看看這個:http://sudokugrab.blogspot.com/2009/07/how-does-it-all-work.html – 2010-10-02 02:04:30

+0

非常感謝! – elliottbolzan 2010-10-02 14:30:34