我很努力地從圖像中的文本變爲粗體。我在這裏附上了圖片。 Tesseract用粗體文字對圖像進行OCR
我已經使用倒OpenCV的圖像的顏色,將其變更爲
我想要的Tesseract給5作爲文本輸出,但我得到一個空值。
帶有多行文本的圖像。未在使用PSM 7,8-或9
我很努力地從圖像中的文本變爲粗體。我在這裏附上了圖片。 Tesseract用粗體文字對圖像進行OCR
我已經使用倒OpenCV的圖像的顏色,將其變更爲
我想要的Tesseract給5作爲文本輸出,但我得到一個空值。
帶有多行文本的圖像。未在使用PSM 7,8-或9
兩個圖像可以與psm
設置爲7
,8
,或9
識別提取從該圖像的數據。如果您使用3.x.x,並且使用--psm 9
,建議使用Tesseract 4.0.0 alpha來改進OCR結果。
Page segmentation mode:
7 Treat the image as a single text line.
8 Treat the image as a single word.
9 Treat the image as a single word in a circle.
希望得到這個幫助。
編輯:
關於對即時以確定要使用的PSM你額外的問題,您可以檢查圖像的高度,以確定psm
值使用。
例如,5
之一的高度爲80,並且fox
消息爲480.使用像素值,實現代碼以更容易設置psm
值。
謝謝,這有助於:) 我在多個圖像上做OCR。如果對於其他圖像,我有多行文本,那麼我如何確定哪些圖像使用了什麼psm。 – kant01
@ kant01你可以編輯你的文章以包含多行圖像樣本? – thewaywewere
@ kant01剛剛看到你的編輯(沒有收件箱消息,因爲你沒有添加評論,注意我@ @)。無論如何,我已經更新了我的答案。如果它有幫助,請看看並勾選答案。 – thewaywewere
我改變了頁面分割模式(PSM)爲7,它的工作原理。我不確定內部發生了什麼。我現在的掙扎是如何在飛行中識別哪些psm需要使用。 – kant01