3
在MediaWiki::DumpFile頁面下面的代碼是存在:如何使用MediaWiki :: DumpFile將Wikipedia XML轉儲轉換爲HTML?
use MediaWiki::DumpFile;
$mw = MediaWiki::DumpFile->new;
$sql = $mw->sql($filename);
$sql = $mw->sql(\*FH);
$pages = $mw->pages($filename);
$pages = $mw->pages(\*FH);
$fastpages = $mw->fastpages($filename);
$fastpages = $mw->fastpages(\*FH);
use MediaWiki::DumpFile::Compat;
$pmwd = Parse::MediaWikiDump->new;
我完全新的Perl和不知道做什麼用$ fastpages保存所有的HTML頁面(或文本,這並不重要)來自XML轉儲。你可以幫我嗎?什麼是* FH?
在搜索提取庫時,我發現這個優秀的頁面:http://medialab.di.unipi.it/wiki/Wikipedia_Extractor。它可以用來代替有問題的方法。 – DSblizzard