在谷歌的tesseract-OCR中使用哪種算法進行識別？

在谷歌的tesseract-OCR中使用哪種算法進行識別？它是神經網絡嗎？在谷歌的tesseract-OCR中使用哪種算法進行識別？

2017-06-07 Chiro Odhora

This paper in the tesseract source提供了該技術的深入概述。

值得注意的是：

斑點被組織成文本行，並且行和區域分析固定的間距或比例文本。

[...]

識別然後作爲一個雙向過程進行。在第一遍中，嘗試依次識別每個單詞。作爲訓練數據，將每個被滿意的詞傳遞給自適應分類器。然後，自適應分類器將有機會更準確地識別頁面下方的文字。

[...]

一旦文本行已經發現，基線配備更精確使用二次樣條曲線。

[...]

基線爲通過劃分斑點成組與合理連續位移的原始直線基線擬合。通過最小二乘擬合將二次樣條擬合到人口最多的分區（假設爲爲基線）。

該論文沒有明確說明它是否使用神經網絡，但給出了我認爲可能的內容，至少對於它的一部分。

有關線上查找的更多信息，請參閱R. Smith，「A Simple and Efficient Skew Detection Algorithm via Text Row Accumulation」，Proc。第三詮釋。 CONF。關於文件分析和識別（第2卷），IEEE 1995，第1145-1148頁。

來源

2017-06-07 19:24:56 msanford

感謝您的鏈接:) –

在谷歌的tesseract-OCR中使用哪種算法進行識別？

回答

相關問題