2012-12-22 61 views
0

如果你看看附加的圖像,你會發現它上面有圖像+文字。我想要的是以這樣一種方式剪裁這個圖像,使得包含它的部分的文本被分離出來,並且該部分的其餘部分被丟棄。我該怎麼做enter image description here如何裁剪圖像以分離包含的文本?

+1

photoshop。! 。:) –

+0

此任務的最新技術具有70%以下的f分數,請注意這一點。你需要簡化你的任務,在你的情況下它是簡化的通行證。你想從整個圖像或瀏覽器中提取文本嗎?只保留瀏覽器窗口。現在,你可以直接訪問這個網站。通過解析其生成的html來製作純文本版本更爲簡單。之後,從中獲取單個圖像並分別處理它們以提取文本。 – mmgp

回答

0

你所要求的是非常困難的。一個圖像識別庫會讓你開始,但它會很難得到一致的結果。這種問題進入了研究領域。這裏的博客文章可能有所幫助:

http://rmtheis.wordpress.com/2011/08/06/using-tesseract-tools-for-android-to-create-a-basic-ocr-app/

+0

你說得對,我正在研究tesseract並詢問這個問題,tesseract只能識別圖像的文本部分,否則會返回垃圾。如何清除圖像的彩色部分只留下文字部分,如http://stackoverflow.com/questions/11678542/image-processing-for-ocr-with-leptonica-inverse-color-text?rq=1 –