2017-03-26 123 views
0

我很努力地從圖像中的文本變爲粗體。我在這裏附上了圖片。 Original ImageTesseract用粗體文字對圖像進行OCR

我已經使用倒OpenCV的圖像的顏色,將其變更爲Inverted color

我想要的Tesseract給5作爲文本輸出,但我得到一個空值。

帶有多行文本的圖像。未在使用PSM 7,8-或9 Multiline text image

+0

我改變了頁面分割模式(PSM)爲7,它的工作原理。我不確定內部發生了什麼。我現在的掙扎是如何在飛行中識別哪些psm需要使用。 – kant01

回答

1

兩個圖像可以與psm設置爲78,或9識別提取從該圖像的數據。如果您使用3.x.x,並且使用--psm 9,建議使用Tesseract 4.0.0 alpha來改進OCR結果。

Page segmentation mode: 
    7 Treat the image as a single text line. 
    8 Treat the image as a single word. 
    9 Treat the image as a single word in a circle. 

希望得到這個幫助。

編輯:

關於對即時以確定要使用的PSM你額外的問題,您可以檢查圖像的高度,以確定psm值使用。

例如,5之一的高度爲80,並且fox消息爲480.使用像素值,實現代碼以更容易設置psm值。

+0

謝謝,這有助於:) 我在多個圖像上做OCR。如果對於其他圖像,我有多行文本,那麼我如何確定哪些圖像使用了什麼psm。 – kant01

+0

@ kant01你可以編輯你的文章以包含多行圖像樣本? – thewaywewere

+0

@ kant01剛剛看到你的編輯(沒有收件箱消息,因爲你沒有添加評論,注意我@ @)。無論如何,我已經更新了我的答案。如果它有幫助,請看看並勾選答案。 – thewaywewere