下面的代碼讀入一些文本(從OCR庫中掃描)a檢查文本中的幾個簡單單詞「the」,「date」,「or」,「to」,「和「....如果它找到這些單詞中的一個,那麼這個函數返回true >>>這意味着它剛纔掃描的頁面是正確的。如果該函數返回false,則該頁面翻轉並轉到一個旋轉該頁面的函數。檢查多個正則表達式匹配的文本
我只是想弄清楚這樣做的最佳方法。我不是正則表達式的主人,但第一個if語句返回true(所以它找到'date')。然而,即使我再次尋找'日期',第二條if語句也會返回false。
做有條件OR ||
不適用於正則表達式嗎?
static Boolean CheckIfPDFisTurnedRightWay(List<tessnet2.Word> wordList)
{
if (wordList.Count >= 70)
{
var text = wordList.Select(w => w.Confidence >= 40 ? w.Text : "DONTMATCH").Aggregate((x, y) => x + " " + y);
if (!Regex.IsMatch(text, @"date", RegexOptions.IgnoreCase))
return false;
if (!Regex.IsMatch(text, @"[trf]h[ec]", RegexOptions.IgnoreCase) | !Regex.IsMatch(text, @"date", RegexOptions.IgnoreCase) || !Regex.IsMatch(text, @"[a0o][tfr]", RegexOptions.IgnoreCase) || !Regex.IsMatch(text, @"[ao]nd", RegexOptions.IgnoreCase) || !Regex.IsMatch(text, @"[frt][o0]", RegexOptions.IgnoreCase))
return false;
}
return true;
}