2
A
回答
1
這是一個hOCR文件的一個片段,爲了可讀性而添加了一些新行。不幸的是,我不記得哪個工具被用來生成它(可能是ocropus),但我認爲tesseract 3.01,也許其他人定義了每個單詞的邊界框,而不是他們的hOCR輸出中的每個字母。
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">
<html>
<head>
<title>
</title>
<meta http-equiv="Content-Type" content="text/html;charset=utf-8" >
</head>
<body>
<p>
<span title="bbox 171 287 184 302">B</span><span title="bbox 186 292 195 302">a</span><span title="bbox 196 292 205 302">n</span><span title="bbox 209 287 217 302">k</span> <span title="bbox 226 287 239 302">A</span><span title="bbox 242 292 250 303">c</span><span title="bbox 252 292 260 303">c</span><span title="bbox 262 292 272 303">o</span><span title="bbox 274 293 283 303">u</span><span title="bbox 285 293 294 303">n</span><span title="bbox 297 291 302 303">t</span> <span title="bbox 309 288 323 303">N</span><span title="bbox 326 293 335 303">u</span><span title="bbox 337 293 353 303">m</span><span title="bbox 354 288 364 303">b</span><span title="bbox 366 293 375 303">e</span><span title="bbox 377 293 380 303">r</span>
</p>
<p>
<span title="bbox 170 340 183 355">B</span><span title="bbox 186 345 195 355">a</span><span title="bbox 196 345 205 355">n</span><span title="bbox 208 340 217 355">k</span> <span title="bbox 225 341 239 355">A</span><span title="bbox 242 340 252 356">d</span><span title="bbox 253 340 263 356">d</span><span title="bbox 264 345 271 355">r</span><span title="bbox 272 345 280 356">e</span><span title="bbox 282 345 289 356">s</span><span title="bbox 291 345 298 356">s</span>
</p>
</body>
</html>
2
您可以使用Tesseract的命令行選項 「HOCR」 輸出結果HOCR格式:
tesseract youimage.tif out hocr
相關問題
- 1. 我在哪裏可以找到大量的文本文件?
- 2. 我在哪裏可以找到$腳本?
- 3. 我在哪裏可以找到LWJGL的樣本用途?
- 4. iPhone - 我在哪裏可以找到GKVoiceChatClient的樣本?
- 5. 我在哪裏可以找到一些UML樣本?
- 6. 在哪裏可以找到log4j.properties文件
- 7. 我在哪裏可以找到我的ca.crt文件的私鑰
- 8. 我在哪裏可以找到我的日誌文件?
- 9. 我在哪裏可以找到我的日誌文件?
- 10. 我在哪裏可以找到我的Localizeable.strings文件?
- 11. 我在哪裏可以找到文件my.cnf或my.ini文件?
- 12. 在哪裏可以找到我的DB2
- 13. 我在哪裏可以找到的UIKit
- 14. 我在哪裏可以找到特定版本的文檔
- 15. 我在哪裏可以找到特定API版本的文檔?
- 16. 哪裏可以找到AlertDialog xml文件
- 17. 我在哪裏可以找到像這樣的$ PS?
- 18. 我在哪裏可以找到WPF DataGridRow的默認樣式
- 19. 我在哪裏可以找到Theme.AppCompat.Light的默認樣式?
- 20. 我在哪裏可以找到谷歌地圖的樣式表
- 21. 我在哪裏可以找到Spark 1.6中的jar文件夾?
- 22. 我在哪裏可以找到npm軟件包的文檔?
- 23. 我在哪裏可以找到.csproj文件的模式(XSD)?
- 24. 我在哪裏可以找到G4結構ANTLR4的g4文件?
- 25. 我在哪裏可以找到'header'事件的文檔?
- 26. 我在哪裏可以找到.vcproj文件結構的參考?
- 27. 我在哪裏可以找到admob的build.gradle文件
- 28. 我在哪裏可以找到openjdk的ext文件夾?
- 29. 我在哪裏可以找到Mac OSX中的「launchd.conf」文件
- 30. 我在哪裏可以找到XAMPP中的MySQL日誌文件