2011-04-28 56 views
5

我有一個文本,其日期可以像這樣:2011-02-02或者像這樣:02/02/2011,這是我迄今爲止寫的,我的問題是,如果有一個很好的將這兩個正則表達式合併爲一個的方法?結合兩個正則表達式C++ 0x

std::regex reg1("(\\d{4})-(\\d{2})-(\\d{2})"); 

std::regex reg2("(\\d{2})/(\\d{2})/(\\d{4})"); 

smatch match; 
if(std::regex_search(item, match, reg1)) 
{ 
     Date.wYear = atoi(match[1].str().c_str()); 
     Date.wMonth = atoi(match[2].str().c_str()); 
     Date.wDay = atoi(match[3].str().c_str()); 
} 
else if(std::regex_search(item, match, reg2)) 
{ 
     Date.wYear = atoi(match[3].str().c_str()); 
     Date.wMonth = atoi(match[2].str().c_str()); 
     Date.wDay = atoi(match[1].str().c_str()); 
} 
+0

一些正則表達式的語法已命名組。 PCRE可以,但我認爲它不支持重名。也許問題是:C++ 0x上的任何正則表達式變體是否支持重複的命名組? – 2011-04-28 08:14:57

+5

我沒有看到好處。這比組合的正則表達式更容易閱讀。這有利於維護,這是不容低估的一個因素。這個代碼甚至可以在沒有文檔的情況下閱讀 - 結合它,你需要記錄「怪物 - 正則表達式」。 – 2011-04-28 08:25:41

回答

5

您可以通過|將兩個正則表達式組合在一起。由於只有一個|可以匹配,因此我們可以連接不同部分的捕獲組並將其視爲一個整體。

std::regex reg1("(\\d{4})-(\\d{2})-(\\d{2})|(\\d{2})/(\\d{2})/(\\d{4})"); 
std::smatch match; 

if(std::regex_search(item, match, reg1)) { 
    std::cout << "Year=" << atoi(match.format("$1$6").c_str()) << std::endl; 
    std::cout << "Month=" << atoi(match.format("$2$5").c_str()) << std::endl; 
    std::cout << "Day=" << atoi(match.format("$3$4").c_str()) << std::endl; 
} 

(可惜的C++ 0x的正則表達式不支持命名捕獲組,否則我建議你在使用命名捕獲,而不是正則表達式的數組循環。)

+0

Arg。沒有命名的捕獲?爲什麼他們遺漏了這個功能呢? – 2011-04-28 09:12:20

+0

@Jörgen:詢問ECMA。 C++的正則表達式基於ECAMScript(Javascript)的正則表達式。 – kennytm 2011-04-28 12:10:05