2013-03-28 78 views
3

我正在看從PYCON http://youtu.be/B1d9dpqBDVA?t=15m34s這次談話圍繞着15:33標記大約從圖像(收據)提取線,然後喂發言者的發言,爲OCR引擎,使文字可以以更好的方式提取。線喂到OCR - 正方體

我有一個類似的需要,我正經過圖像OCR引擎。但是,我不太明白他的意思是從圖像中提取線條。我可以使用哪些開源工具從圖像中提取線條?

+0

在3年後..你找到答案上面的問題? – joost

回答

0

我可以告訴你一個簡單的技術,將圖像輸入到OCR中。只需執行一些操作即可獲得圖像的ROI(感興趣區域),並將圖像二值化後的區域進行本地化。然後您可以找到輪廓,並通過保持threasholding值,並設置所需的輪廓區域,您可以將生成的圖像提供給OCR :) .. (對不起,壞的解釋方式)

+0

和工具,我會建議Emgu CV。它是有點兒包裝器OpenCV的閱覽室,使用它在C#..我在執行CV Emgu的 – Zeeshan

+0

相同的任務,你能解決您的語法?即「我可以告訴你」。 – sashoalm

2

看看用於文本的detect the skew angle

組是行用於圖像(這是有趣的部分)上分離的文本。

從這個結果可以很容易地檢測每個文本行的上/下限。文本本身將位於它們內部。我以前也遇到過類似的問題,the code可能對你有用:

所有你需要從這裏做的是作物每對線和飼料,作爲一個圖像正方體。

0

直接回答:您提取轉換從霍夫的圖像線條。 你可以找到一個分析指南here。 文本行也可被檢測到。 Karlphillip的回答也基於Hough變換。

enter image description here enter image description here