2011-01-14 33 views
0

我有一個包含信息表的html文件,我試圖提取特定的列。該模式是這樣的交替「TableDarkRow」和「TableLightRow」:使用正則表達式從文件中提取信息並需要幫助

'>817338284254611</A></td><td Class='TableDarkRow' NOWRAP> 01/14/2011</td> 

而且我試圖提取數字和日期對的數組:

817338284254611 
01/14/2011 

我試圖和想出了這樣的:

>([0-9])+</A>(.*)NOWRAP> ?([0-9]{2}\/[0-9]{2}\/[0-9]{4}) 

(.*)是允許的第一個和最後事件之間選擇整個文檔。

回答

0

嘗試這一個(沒有測試):

/[0-9\/ ]+/ 
0

你可以用`[A-ZA-Z '<> \噸] +' 取代.*