我試過在這張圖片上的tesseract和一些帶矩形內文字的掃描圖片。但每次都會有一些垃圾文本作爲輸出失敗。並糾正沒有框周圍的文字。請告訴我如何處理圖像或tesseract?請幫助
回答
正方體的圖像轉換分級前爲灰度,所以粉色系很可能被拾起爲文本。
僅提取從圖像中黑色像素,並且你應該罰款。您可以使用ImageMagick。
正如之前所說的,你應該得到這樣做OCR前擺脫粉色系(他們仍然有用 彷彿字符邊界)
一旦你extacted您gliphs和二元化他們(轉換爲位圖),您可以啓動到 使用tesseract就可以了。請記住,tesseract使用形狀提取方法並依賴於字典支持 - 您可以通過不變時刻獲得更好的結果(和更快的處理時間),如Hu
如果您對java base方法感興趣,那麼這裏是我們的OCR庫這只是在做純Java(可移植到其他語言):
謝謝,但你能告訴我圖像處理方法來刪除或檢測這些盒子因爲我必須處理與這樣的領域的圖像。 –
這是基本的圖像處理的東西。遍歷圖像並檢查像素的顏色 - 如果他們的色調已關閉,則將其丟棄。你也可以計算積分inmages(在同一個y座標中的所有粉紅色像素的總和 - 它會給你峯值,你必須切割寶石),我會建議讓你的岡薩雷斯(或類似的書)。您還可以看看javaocr,項目提供的樣品有可能是你 –
好,謝謝我wiil嘗試DAT一些線索 –
- 1. 爲什麼此CGRectContainsPoint失敗?
- 2. 爲什麼此傳送命令失敗?
- 3. 爲什麼此CMP指令失敗?
- 4. 爲什麼此頁面方法失敗?
- 5. 爲什麼此CollectionAssert.AreEquivalent()測試失敗?
- 6. 爲什麼此更新失敗?
- 7. 爲什麼此測試失敗?
- 8. 此代碼爲什麼編譯失敗?
- 9. 爲什麼此SPF記錄失敗?
- 10. 爲什麼此SQL查詢失敗
- 11. 爲什麼此PDO連接失敗?
- 12. 爲什麼此cpp程序失敗?
- 13. 爲什麼此Lucene.Net查詢失敗?
- 14. 爲什麼此XDocument驗證失敗?
- 15. 爲什麼tesseract-ocr在這種情況下會失敗?
- 16. 爲什麼圖像消失?
- 17. 爲什麼圖像消失?
- 18. 爲什麼不繪製此圖像?
- 19. 爲什麼不顯示此圖像?
- 20. 爲什麼不顯示此圖像?
- 21. 爲什麼圖像上傳失敗php的is_uploaded_file檢查?
- 22. AS3 ios cameraUI保存並加載圖像失敗,爲什麼?
- 23. 爲什麼SerialPort.Open()失敗?
- 24. 爲什麼AVAudioRecorder prepareToRecord失敗?
- 25. 爲什麼av_write_trailer失敗?
- 26. 爲什麼assert_called_with失敗?
- 27. 爲什麼file.exists()失敗?
- 28. 爲什麼CToolBar :: LoadToolBar失敗?
- 29. 爲什麼用'['失敗?
- 30. 爲什麼JSON.parse(「串」)失敗
後無論你已經試過.. –
我曾嘗試用去除其像素值的矩形。 –
he he:D .. ithe marathi允許ahe ka? btw mala yacha uttar mahit nahi kaaran mi tesseract var kaam kela nahi。抱歉! –