2
我面臨着一個令人困惑的問題,嘗試下載圖像並打開它與BytesIO,以從中提取文本使用PIL & pytesseract。從URL打開圖像文件與PIL用於pytesseract文本識別
>>> response = requests.get('http://abc/images/im.jpg')
>>> img = Image.open(BytesIO(response.content))
>>> img
<PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=217x16 at 0x7FDAD185CB38>
>>> text = pytesseract.image_to_string(img)
>>> text
''
這裏給出一個空字符串。
但是,如果我保存圖像,然後用pytesseract再次打開它,它會給出正確的結果。
>>> img.save('im1.jpg')
>>> im = Image.open('im1.jpg')
>>> pytesseract.image_to_string(im)
'The right text'
而只是爲了確認,兩者給出相同的大小。
>>> im.size
(217, 16)
>>> img.size
(217, 16)
可能是什麼問題?是否有必要保存圖像或我做錯了什麼?
什麼一些反饋的答案我有provi這些信息呢? – Claudio