2017-06-07 35 views

回答

2

This paper in the tesseract source提供了該技術的深入概述。

值得注意的是:

斑點被組織成文本行,並且行和區域 分析固定的間距或比例文本。

[...]

識別然後作爲一個雙向過程進行。在第一遍中, 嘗試依次識別每個單詞。作爲訓練數據,將每個被滿意的詞傳遞給自適應分類器。然後, 自適應分類器將有機會更準確地識別頁面下方的文字 。

[...]

一旦文本行已經發現,基線配備更精確 使用二次樣條曲線。

[...]

基線爲通過劃分斑點成組與 合理連續位移的原始直線基線擬合。 通過最小二乘擬合將二次樣條擬合到人口最多的分區(假設爲 爲基線)。

該論文沒有明確說明它是否使用神經網絡,但給出了我認爲可能的內容,至少對於它的一部分。

有關線上查找的更多信息,請參閱R. Smith,「A Simple and Efficient Skew Detection Algorithm via Text Row Accumulation」,Proc。第三詮釋。 CONF。關於文件分析和識別(第2卷),IEEE 1995,第1145-1148頁。

+1

感謝您的鏈接:) –