2010-07-05 21 views
2

我想根據放置在其中的各種文本標記來剪切圖像。標記的字體/大小取決於我。我如何獲得一些文本的座標是圖像的一部分?

我知道商業OCR包提供這在他們的API,但我希望我可以自己編碼。

理想情況下,我不必像素去像素和比較標記文本的圖像。

我擅長用C++/C#,Java和PHP和其他語言,其中這樣的庫中存在...

+2

OCR肯定需要深刻的信號理論知識。如果你甚至不知道從哪裏開始,那麼你不可能自己寫這個。你爲什麼不想使用外部'API'? – ereOn 2010-07-05 13:31:12

回答

0

如果你想要做一個真正sufisticated的解決方案,你可以使用Hough變換。它通常用於增強現實的東西 - 那裏有必要在圖像中找到某個標記。 Ofc你將不得不改變你的標記點,這可能嗎? ;-) 霍夫會給你你的標記線的位置,因此你要切出的區域。

這是一個關於霍夫的鏈接,但還有很多其他的。

Hough

或者這一個

Wiki

1

理想的情況下我也不會去像素 像素和比較反對的 標記文本的圖像。

那麼,如果你想找到標記圖像,那麼這正是你必須做的。

這是一個想法...將標記文本設置爲特定顏色,然後處理背景圖像以確保它沒有任何這種顏色的像素。在這一點上找到標記應該變得容易得多。

1

條形碼比文本標記更易於檢測。您始終可以將它們放在一起,條形碼用於自動位置檢測以及供用戶使用的文本。

0

A fiduciary marker會比文字更好。這就是他們用於增強現實等等。

如果文字總是相同的大小,形狀和方向相同,則可以使用normalized cross-correlation

「理想情況下,我不必將像素映射到像素,並與標記文本的圖像進行比較。」

那麼你該怎麼做呢?你只會搜索圖像的一部分?

相關問題