我要提取其中有看起來像下面的圖片經緯度數據的視頻文字:如何OCR低分辨率圖像
的形象是非常低的分辨率和正方體和在線OCR未能在沒有任何處理的情況下提取文本。我試圖使用this刪除灰色背景,並減去灰色矩陣,但它沒有產生有意義的輸出。我轉換爲HSV來提取黃色的文字,但又沒有得到有意義的結果。
我想知道是否有什麼辦法可以提取文本。最有希望的領先地位似乎是背景灰度,文字是半透明的黃色。
我要提取其中有看起來像下面的圖片經緯度數據的視頻文字:如何OCR低分辨率圖像
的形象是非常低的分辨率和正方體和在線OCR未能在沒有任何處理的情況下提取文本。我試圖使用this刪除灰色背景,並減去灰色矩陣,但它沒有產生有意義的輸出。我轉換爲HSV來提取黃色的文字,但又沒有得到有意義的結果。
我想知道是否有什麼辦法可以提取文本。最有希望的領先地位似乎是背景灰度,文字是半透明的黃色。
的主要問題與這些圖像是段的字符。如果他們有一個固定的地方,你就完成了。 (跳到下一段。)
如果沒有,通過剖面分析定位字符組之間的空隙開始,以減輕任務。對於每個組,嘗試識別最左邊的字符,然後跳過它以轉到下一個字符,依此類推。
字符識別可通過用相同的字體的參考符號直SAD或SSD比較製成。
不要指望太好的結果。
一般而言,DPI只是一個數字,所以你可以改變它(我不知道如何在python,但應該有一種方式)。在將它傳遞給OCR引擎之前,請嘗試將其更改爲200或300。 如果沒有幫助,嘗試重新調整其大小200%,除DPI設置爲300 此外,最佳效果的OCR是黑白圖像,從而嘗試在圖像上應用圖像處理將其變成黑色和白色。 我發現下面的鏈接,可以幫助你與: Using python PIL to turn a RGB image into a pure black and white image
「更改DPI 「對於現有的視頻沒有任何意義。放大不會改善圖像質量。的確,顏色在這裏並沒有真正的幫助。 –
是的。調整圖像大小使其變得模糊並且不會提高識別效果 –
嘗試應用插值算法(如resample)來增強調整大小後的圖像。 – David
你可以不斷嘗試各種圖像處理技術,但在一定的水平也將是極其困難/幾乎不可能能夠提取任何OCR數據。這看起來就像其中一種情況,但如果真的需要這樣做,那麼你只能繼續嘗試各種方法。 – TheLethalCoder
** JPG **壓縮更加衰減......您可以嘗試淡化文字或僅提取黃色強度的峯值,但圖像質量如此之低以至於甚至無法閱讀人物......您可以嘗試[簡單的OCR](http://stackoverflow.com/a/22879053/2521214)我有其優於神經網絡分類器在低質量或非常嘈雜的輸入,但不抱太高的期望... – Spektre