0
我試圖從我從OCR格式的pdf文件中提取的文本中搜索單詞。這個pdf文件有多個頁面,所以對於每個頁面我搜索一個詞,如果找到這個詞,那麼我不希望for循環繼續,我使用了代碼,但它只停留在第一頁上。這個代碼中缺少什麼? 這裏是代碼如果在r條件的條件中出現中斷條件
for(i in 1:8){
img_file <- pdftools::pdf_convert("D:/Files_OCR/test.pdf", format = 'tiff', pages = i, dpi = 400)
text <- ocr(img_file)
ocr_text <- capture.output(cat(text))
check=sapply(ocr_text, paste0, collapse="")
if(length(which(stri_detect_fixed(tolower(check),tolower("school")))) <= 0){ print("Not Present") } else {print("Present")}
if(br=="present")
break
}
任何建議是可觀的。
感謝
這適用於下面的例子:'對(我在SSSS){如果(我== 「helo」)休息;打印(ⅰ)}'。 – lmo