2017-03-03 58 views
2

我正在使用Pytesseract,當我使用英語時它正在工作,但是當我開始使用俄語時。我有這樣的問題:從圖像中提取文本。 OCR

"TypeError: 'str' does not support the buffer interface". I've tried other language it also doesn't work.

這是我的代碼:

from PIL import Image 
from pytesseract import image_to_string 
k=image_to_string(Image.open("ff.jpg"), lang="rus") 
print(image_to_string(Image.open("picture.jpg"), lang="rus")) 

有人可以幫我解決這個問題呢?

回答

1

你需要爲正方體特定語言培訓數據 你需要複製的語言支持的文件系統中的 僅供參考,您可以訪問該網站: - https://github.com/tesseract-ocr/langdata

+0

感謝您的幫助) –

0

請把訓練數據文件(rus.traineddata )在tesseract安裝的tessdata文件夾中輸入所需語言。