我想解析一些複雜/繁重的HTML頁面。我最近閱讀了關於CsQuery的內容並檢查了性能比較CsQuery Vs Html Agility Pack and Fizzler。根據這些測試,由於創建索引,CsQuery在創建DOM時變得更慢。假設我想選擇一個重html頁面的特定元素(沒有id),並且我知道它的祖先的ID,我將它用作上下文元素。如果我將這個沉重的html加載到DOM中,它會很慢,因此我的
我工作的一個腳本動態提取數據使用這個自定義類提取一些字符串/數據從HTML文件(Nagios的狀態頁面,在這種情況下): ## tagLister.py
from sgmllib import SGMLParser
class TAGLister(SGMLParser):
def reset(self):
SGMLParser.reset(self)
se
我試圖找到標籤與perl腳本一個HTML。 use WWW::Mechanize::Firefox;
use Crypt::SSLeay;
use HTML::TokeParser;
$ENV{PERL_LWP_SSL_VERIFY_HOSTNAME}=0;
my $mech = WWW::Mechanize::Firefox->new;
$mech->get_local('salid