我如何獲得一些文本的座標是圖像的一部分？

我想根據放置在其中的各種文本標記來剪切圖像。標記的字體/大小取決於我。我如何獲得一些文本的座標是圖像的一部分？

我知道商業OCR包提供這在他們的API，但我希望我可以自己編碼。

理想情況下，我不必像素去像素和比較標記文本的圖像。

我擅長用C++/C＃，Java和PHP和其他語言，其中這樣的庫中存在...

2010-07-05 kdawg

OCR肯定需要深刻的信號理論知識。如果你甚至不知道從哪裏開始，那麼你不可能自己寫這個。你爲什麼不想使用外部'API'？ – ereOn 2010-07-05 13:31:12

如果你想要做一個真正sufisticated的解決方案，你可以使用Hough變換。它通常用於增強現實的東西 - 那裏有必要在圖像中找到某個標記。 Ofc你將不得不改變你的標記點，這可能嗎？ ;-) 霍夫會給你你的標記線的位置，因此你要切出的區域。

這是一個關於霍夫的鏈接，但還有很多其他的。

或者這一個

2010-07-05 13:30:25 InsertNickHere

理想的情況下我也不會去像素像素和比較反對的標記文本的圖像。

那麼，如果你想找到標記圖像，那麼這正是你必須做的。

這是一個想法...將標記文本設置爲特定顏色，然後處理背景圖像以確保它沒有任何這種顏色的像素。在這一點上找到標記應該變得容易得多。

2010-07-05 14:39:55

條形碼比文本標記更易於檢測。您始終可以將它們放在一起，條形碼用於自動位置檢測以及供用戶使用的文本。

2010-07-16 14:44:21 rwong

A fiduciary marker會比文字更好。這就是他們用於增強現實等等。

如果文字總是相同的大小，形狀和方向相同，則可以使用normalized cross-correlation。

「理想情況下，我不必將像素映射到像素，並與標記文本的圖像進行比較。」

那麼你該怎麼做呢？你只會搜索圖像的一部分？

2010-08-09 16:38:24 endolith

回答