我需要維基百科的我的國家的城市頁面在我的網站上使用。 例如New York會有一個關於城市的主頁。所以如果我有一個城市的列表,我該如何下載頁面?
如何從維基百科使用腳本複製頁面?
這將是1000年的城市。
我也聽說維基百科不喜歡漫遊器訪問它的頁面。 我將根據Creative Commons許可證使用這些信息。
如果我能夠在perl腳本中編寫代碼,那會很好。
我需要維基百科的我的國家的城市頁面在我的網站上使用。 例如New York會有一個關於城市的主頁。所以如果我有一個城市的列表,我該如何下載頁面?
如何從維基百科使用腳本複製頁面?
這將是1000年的城市。
我也聽說維基百科不喜歡漫遊器訪問它的頁面。 我將根據Creative Commons許可證使用這些信息。
如果我能夠在perl腳本中編寫代碼,那會很好。
你可以使用WWW::Wikipedia
:
#!/usr/bin/env perl
use strict;
use warnings;
use WWW::Wikipedia;
my $wiki = WWW::Wikipedia->new();
my $entry = $wiki->search('New York');
binmode STDOUT, ':utf8';
print $entry->fulltext();
讀阿布牛逼文本返回方法WWW::Wikipedia::Entry
:
時,他們所提供的數據可自由下載你不應該湊百科:
http://en.wikipedia.org/wiki/Wikipedia:Database_download
以及如何使用它的提示:
http://en.wikipedia.org/wiki/Wikipedia:Database_download#Help_parsing_dumps_for_use_in_scripts
然後,你可以簡單地使用已經提供給您的工具:
http://search.cpan.org/dist/MediaWiki-DumpFile
或者,如果你真的想只是一個已知的,有限的子集,有可用的API:
http://www.mediawiki.org/wiki/API
要使用Perl的你會開始看LWP和JSON模塊,或者,還可以利用CPAN:http://search.cpan.org/dist/MediaWiki-API
同樣的'特別:Export'頁。 – icktoofay 2011-04-13 06:12:11
這記錄在http://www.mediawiki.org/wiki/Manual:Parameters_to_Special:Export。 – daxim 2011-04-13 09:07:43