2016-09-05 99 views
0

是否可以使用pyocrTesseract從圖像中獲取字體大小? 以下是我的代碼。用Tesseract和Pyocr獲取Python中的字體大小

tools = pyocr.get_available_tools() 
tool = tools[0] 
txt = tool.image_to_string(
     Imagee.open(io.BytesIO(req_image)), 
     lang=lang, 
     builder=pyocr.builders.TextBuilder() 
) 

這裏我使用函數image_to_string從圖像中獲取文本。而現在,我的問題是,如果我能得到我的文本font-size(數字)。

+0

嘗試修改示例代碼爲[MCVE]。 – boardrider

回答

0

使用tesserocr,您可以將您的圖像,以便您可以調用WordFontAttributes方法來獲取你需要的信息,調用Recognize後得到ResultIterator。閱讀該方法的文檔以獲取更多信息。

import io 
import tesserocr 
from PIL import Image 

with tesserocr.PyTessBaseAPI() as api: 
    image = Image.open(io.BytesIO(req_image)) 
    api.SetImage(image) 
    api.Recognize() # required to get result from the next line 
    iterator = api.GetIterator() 
    print iterator.WordFontAttributes() 

輸出示例:

{'bold': False, 
'font_id': 283, 
'font_name': u'Times_New_Roman', 
'italic': False, 
'monospace': False, 
'pointsize': 9, 
'serif': True, 
'smallcaps': False, 
'underlined': False}