-2
我有一個帶有三個表格的html文件。但我只想提取三個表中的一個。我該怎麼做呢?使用perl從多表html文件中提取特定表格
我有一個帶有三個表格的html文件。但我只想提取三個表中的一個。我該怎麼做呢?使用perl從多表html文件中提取特定表格
提取HTML文檔部分的好模塊是HTML::Query
。
它提供了一個類似jQuery的界面,用於選擇要提取的文檔的哪一部分。
您可以使用諸如衆所周知Perl
模塊做到這一點:
LWP
WWW::Mechanize
HTML::TreeBuilder
HTML::TreeBuilder::XPath
最後一個Perl模塊,是真正有用的,你可以使用Xpath
這樣的表達式:
//table[0]/tr[3]/td[2]/text()
通過實例,從第一table
打印第二td
元素的文本中的第三tr
。
[Mojo :: DOM](http://p3rl.org/Mojo::DOM)提供了一整套CSS3選擇器,包括['n-type-type'](http://mojolicio.us/perldoc/Mojo/DOM/CSS#Enthoftypen),它似乎HTML :: Query缺乏 –