我試圖通過「table」標記及其內容拆分html代碼塊。Perl - 通過「table」標記及其內容拆分html代碼
所以,我想
my $html = 'aaa<table>test</table>bbb<table>test2</table>ccc';
my @values = split(/<table*.*\/table>/, $html);
在這之後,我想@values陣列看起來像這樣: array('aaa', 'bbb', 'ccc')
。 但是它返回這個數組: array('aaa', 'ccc')
。 任何人都可以告訴我如何指定分割函數,每個表應該分別解析?
謝謝!
解析HTML時,請使用HTML解析器。 Perl有一個好的,IIRC。 – You
http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454 –