Tesseract用粗體文字對圖像進行OCR

我很努力地從圖像中的文本變爲粗體。我在這裏附上了圖片。 Original Image Tesseract用粗體文字對圖像進行OCR

我已經使用倒OpenCV的圖像的顏色，將其變更爲 Inverted color

我想要的Tesseract給5作爲文本輸出，但我得到一個空值。

帶有多行文本的圖像。未在使用PSM 7,8-或9 Multiline text image

2017-03-26 kant01

我改變了頁面分割模式（PSM）爲7，它的工作原理。我不確定內部發生了什麼。我現在的掙扎是如何在飛行中識別哪些psm需要使用。 – kant01

兩個圖像可以與psm設置爲7，8，或9識別提取從該圖像的數據。如果您使用3.x.x，並且使用--psm 9，建議使用Tesseract 4.0.0 alpha來改進OCR結果。

Page segmentation mode: 
    7 Treat the image as a single text line. 
    8 Treat the image as a single word. 
    9 Treat the image as a single word in a circle.

希望得到這個幫助。

編輯：

關於對即時以確定要使用的PSM你額外的問題，您可以檢查圖像的高度，以確定psm值使用。

例如，5之一的高度爲80，並且fox消息爲480.使用像素值，實現代碼以更容易設置psm值。

來源

2017-03-27 14:15:39 thewaywewere

謝謝，這有助於:) 我在多個圖像上做OCR。如果對於其他圖像，我有多行文本，那麼我如何確定哪些圖像使用了什麼psm。 – kant01

@ kant01你可以編輯你的文章以包含多行圖像樣本？ – thewaywewere

@ kant01剛剛看到你的編輯（沒有收件箱消息，因爲你沒有添加評論，注意我@ @）。無論如何，我已經更新了我的答案。如果它有幫助，請看看並勾選答案。 – thewaywewere

Tesseract用粗體文字對圖像進行OCR

回答

相關問題