2013-03-04 54 views
-2
  1. 我們已通過與具有文本「Hello World」和正方體OCR完美顯示效果的「Hello World」單行的圖像。如何使用Tesseract OCR從圖像中提取多行?

  2. 但是,當我們與多行文本

世界,你好
通過圖像你怎麼

它不會顯示任何東西。有什麼問題?任何人都可以幫助我嗎?我需要迫切help.please answer.Thanks提前:)

這裏是我們的代碼:

#include "stdafx.h" 
#include <iostream> 
#include <baseapi.h> 
#include <allheaders.h> 
#include <fstream> 

using namespace std; 

int _tmain(int argc, _TCHAR* argv[]) 

{ 

    tesseract::TessBaseAPI api; 

api.Init("", "eng", tesseract::OEM_DEFAULT); 
api.SetPageSegMode(static_cast<tesseract::PageSegMode>(7)); 
api.SetOutputName("out"); 

cout<<"File name:"; 
char image[256]; 
cin>>image; 
PIX *pixs = pixRead(image); 

STRING text_out; 
api.ProcessPages(image, NULL, 0, &text_out); 

cout<<text_out.string(); 

ofstream files; 
files.open("out.txt"); 
files << text_out.string()<<endl; 
files.close(); 

cin>> image; 
return 0; 
} 

回答

0

網頁分塊模式7個對待的圖像作爲一個單一的文本行。嘗試3,這是全自動頁面分割,但沒有OSD(默認)。