我需要使用perl讀取包含相似結構的許多HTML文件。Perl中的模式所需的單行正則表達式
結構由 STRRRR ... E的
- 小號 = HTML頭表開始
- 牛逼 =獨特的表結構開始在HTML文件中之前(我可以找出它)
- R =一組html元素(這些都是tr的,我也可以識別它)
- Ë =所有其餘 - singnifies端面R的
我想提取所有的R的陣列中採用單線 「M」 perlop得到。
我正在尋找這樣的事情:
@all_Rs = $ HTMLFILE = - M {ST(R)* E} GS;
但它從來沒有解決。
到現在爲止我一直在做四圍的方式做到這一點喜歡使用刪除不需要的文本,用於循環等 我想從這個頁面中提取的所有行:http://www.trainenquiry.com/StaticContent/Railway_Amnities/Enquiry%20-%20North/STATIONS.aspx ,有許多這樣的頁面。
這是今天的第三或第四次,有人想用正則表達式做一些事情,但堅持用一個singel,光榮的正則表達式來做。這是一項運動,還是什麼?我放棄了我的一部分。只有這麼多:這是合理的,以堅持在一個大表達式(而不是函數,模塊等)中具有複雜的功能 – Ingo 2011-03-25 14:38:06
不要用正則表達式解析HTML:http://stackoverflow.com/questions/590747/using-regular-expressions-to-parse-html-why-not – reinierpost 2011-03-25 14:57:47
你有S,T,R和E正則表達式嗎?如果是,並且他們單獨工作,則可以像您概述的那樣將它們組合在一起。 – bvr 2011-03-25 15:01:57