我想根據放置在其中的各種文本標記來剪切圖像。標記的字體/大小取決於我。我如何獲得一些文本的座標是圖像的一部分?
我知道商業OCR包提供這在他們的API,但我希望我可以自己編碼。
理想情況下,我不必像素去像素和比較標記文本的圖像。
我擅長用C++/C#,Java和PHP和其他語言,其中這樣的庫中存在...
我想根據放置在其中的各種文本標記來剪切圖像。標記的字體/大小取決於我。我如何獲得一些文本的座標是圖像的一部分?
我知道商業OCR包提供這在他們的API,但我希望我可以自己編碼。
理想情況下,我不必像素去像素和比較標記文本的圖像。
我擅長用C++/C#,Java和PHP和其他語言,其中這樣的庫中存在...
理想的情況下我也不會去像素 像素和比較反對的 標記文本的圖像。
那麼,如果你想找到標記圖像,那麼這正是你必須做的。
這是一個想法...將標記文本設置爲特定顏色,然後處理背景圖像以確保它沒有任何這種顏色的像素。在這一點上找到標記應該變得容易得多。
條形碼比文本標記更易於檢測。您始終可以將它們放在一起,條形碼用於自動位置檢測以及供用戶使用的文本。
A fiduciary marker會比文字更好。這就是他們用於增強現實等等。
如果文字總是相同的大小,形狀和方向相同,則可以使用normalized cross-correlation。
「理想情況下,我不必將像素映射到像素,並與標記文本的圖像進行比較。」
那麼你該怎麼做呢?你只會搜索圖像的一部分?
OCR肯定需要深刻的信號理論知識。如果你甚至不知道從哪裏開始,那麼你不可能自己寫這個。你爲什麼不想使用外部'API'? – ereOn 2010-07-05 13:31:12