2017-04-12 50 views
0

Tesseract wiki中,要在訓練中使用的標記的tif/box文件文件名格式爲[lang].[fontname].exp[num]fontname實際上是否會影響培訓或僅僅是爲了簿記?Tesseract box/tif文件名中的字體名稱是否重要?

在我的特殊情況下,我有大量不同字體的文檔圖像(並且我不知道其中包含哪些字體)。我可以爲手動標記的每個文檔使用eng.idontknow.exp[num]嗎?或者由於某種原因,這會搞亂培訓嗎?提前致謝!

回答

0

最好匹配一個真實的字體(以幫助可能的OCR分析),但它可以是一些任意的字體名稱。