2013-07-31 52 views
1

下面的代碼讀入一些文本(從OCR庫中掃描)a檢查文本中的幾個簡單單詞「the」,「date」,「or」,「to」,「和「....如果它找到這些單詞中的一個,那麼這個函數返回true >>>這意味着它剛纔掃描的頁面是正確的。如果該函數返回false,則該頁面翻轉並轉到一個旋轉該頁面的函數。檢查多個正則表達式匹配的文本

我只是想弄清楚這樣做的最佳方法。我不是正則表達式的主人,但第一個if語句返回true(所以它找到'date')。然而,即使我再次尋找'日期',第二條if語句也會返回false。

做有條件OR ||不適用於正則表達式嗎?

static Boolean CheckIfPDFisTurnedRightWay(List<tessnet2.Word> wordList) 
     { 
      if (wordList.Count >= 70) 
      { 
       var text = wordList.Select(w => w.Confidence >= 40 ? w.Text : "DONTMATCH").Aggregate((x, y) => x + " " + y); 
       if (!Regex.IsMatch(text, @"date", RegexOptions.IgnoreCase)) 
        return false; 
       if (!Regex.IsMatch(text, @"[trf]h[ec]", RegexOptions.IgnoreCase) | !Regex.IsMatch(text, @"date", RegexOptions.IgnoreCase) || !Regex.IsMatch(text, @"[a0o][tfr]", RegexOptions.IgnoreCase) || !Regex.IsMatch(text, @"[ao]nd", RegexOptions.IgnoreCase) || !Regex.IsMatch(text, @"[frt][o0]", RegexOptions.IgnoreCase)) 
        return false;        
      } 
       return true;   
     } 

回答

1

IsMatch只是返回一個布爾值,所以你應該能夠使用||

您可能有一個錯字。退房的單管你的前兩個!Regex.IsMatch語句之間:

if (!Regex.IsMatch(text, @"[trf]h[ec]", RegexOptions.IgnoreCase) 
    | !Regex.IsMatch(text, @"date", RegexOptions.IgnoreCase) 
    || ... 

另外,如果你只是想return false如果沒有在第二個表達式的if語句是一個比賽,你可能想使用&&操盤手。

if ((text doesn't match 1st expression) and (text doesn't match 2nd expr) and ...) 
    return false; 
1

爲了簡化/提高可讀性,您可以評估不同「或」在一個單一的正則表達式的表達式是這樣的:

if(!Regex.IsMatch(@"(date|[trf]h[ec]|[a0o][tfr])", RegexOptions.IgnoreCase)