在谷歌的tesseract-OCR中使用哪種算法進行識別?它是神經網絡嗎?在谷歌的tesseract-OCR中使用哪種算法進行識別?
3
A
回答
2
This paper in the tesseract source提供了該技術的深入概述。
值得注意的是:
斑點被組織成文本行,並且行和區域 分析固定的間距或比例文本。
[...]
識別然後作爲一個雙向過程進行。在第一遍中, 嘗試依次識別每個單詞。作爲訓練數據,將每個被滿意的詞傳遞給自適應分類器。然後, 自適應分類器將有機會更準確地識別頁面下方的文字 。
[...]
一旦文本行已經發現,基線配備更精確 使用二次樣條曲線。
[...]
基線爲通過劃分斑點成組與 合理連續位移的原始直線基線擬合。 通過最小二乘擬合將二次樣條擬合到人口最多的分區(假設爲 爲基線)。
該論文沒有明確說明它是否使用神經網絡,但給出了我認爲可能的內容,至少對於它的一部分。
有關線上查找的更多信息,請參閱R. Smith,「A Simple and Efficient Skew Detection Algorithm via Text Row Accumulation」,Proc。第三詮釋。 CONF。關於文件分析和識別(第2卷),IEEE 1995,第1145-1148頁。
相關問題
- 1. 使用SVM在matlab中進行拇指識別算法algo
- 2. 歌曲識別算法
- 3. SortBy在Spark中使用哪種算法?
- 4. 使用哪種語音識別系統?
- 5. 谷歌雲計算無法識別任何資源
- 6. 使用哪種算法進行字母排序?
- 7. 我可以使用哪種算法進行quadrilater/cube檢測?
- 8. Rsync使用哪種算法進行增量編碼?
- 9. 使用Harris算法進行圖像識別功能
- 10. 使用最近鄰算法進行圖像模式識別
- 11. 在Laravel中使用TesseractOCR
- 12. ccache中使用哪種緩存算法?
- 13. 無法使用AutoHotkey識別谷歌瀏覽器窗口
- 14. 谷歌語音識別不起作用
- 15. 谷歌日曆,共享,用戶識別
- 16. mysql使用哪種算法搜索表中的一行?
- 17. 使用ActionCable和多種識別方法
- 18. Scala無法識別要調用哪種方法
- 19. 有沒有一種方法來識別與PHP的谷歌機器人?
- 20. 哪種方法後是在谷歌共享再加上Android的
- 21. Pocketsphinx VS谷歌的語音識別API
- 22. 谷歌語音識別上的短片
- 23. 谷歌的語音識別API
- 24. Android視覺中使用哪種字符識別技術
- 25. 正在使用哪種手勢識別器?
- 26. 使用antnet算法在ns2中進行特別仿真
- 27. ProtectedData使用哪種加密算法?
- 28. MongoDB使用哪種算法_id
- 29. scipy.optimize.leastsq使用哪種優化算法?
- 30. 哪種激發MLIB算法使用?
感謝您的鏈接:) –