-1
我需要一個定製的想法來檢測圖像中的字幕。也許一些圖像處理步驟能夠正確地從處理後的圖像中提取(例如tesseract)字符。檢測圖像中的字幕
我需要一個定製的想法來檢測圖像中的字幕。也許一些圖像處理步驟能夠正確地從處理後的圖像中提取(例如tesseract)字符。檢測圖像中的字幕
爲什麼不削減圖像的底部,然後對此應用tesseract? 在bash上,我會把以下內容放在bash腳本中,並將它應用於所有圖像(例如xargs):
# filenames
input="$1"
extension=$(echo $(echo "$input"|sed 's/.*\.//g'))
nomfich=$(basename $input .$extension)
interm="$nomfich.tiff"
# convert to tiff and crop
convert -gravity South -crop 100%x15%+0+0 -density 300 $input $interm
# ocr
tesseract $interm $nomfich