2011-04-13 36 views
0

我需要維基百科的我的國家的城市頁面在我的網站上使用。 例如New York會有一個關於城市的主頁。所以如果我有一個城市的列表,我該如何下載頁面?
如何從維基百科使用腳本複製頁面?

這將是1000年的城市。

我也聽說維基百科不喜歡漫遊器訪問它的頁面。 我將根據Creative Commons許可證使用這些信息。

如果我能夠在perl腳本中編寫代碼,那會很好。

回答

5

時,他們所提供的數據可自由下載你不應該湊百科:

http://en.wikipedia.org/wiki/Wikipedia:Database_download

以及如何使用它的提示:

http://en.wikipedia.org/wiki/Wikipedia:Database_download#Help_parsing_dumps_for_use_in_scripts

然後,你可以簡單地使用已經提供給您的工具:

http://search.cpan.org/dist/MediaWiki-DumpFile

或者,如果你真的想只是一個已知的,有限的子集,有可用的API:

http://www.mediawiki.org/wiki/API

要使用Perl的你會開始看LWP和JSON模塊,或者,還可以利用CPAN:http://search.cpan.org/dist/MediaWiki-API

+0

同樣的'特別:Export'頁。 – icktoofay 2011-04-13 06:12:11

+0

這記錄在http://www.mediawiki.org/wiki/Manual:Parameters_to_Special:Export。 – daxim 2011-04-13 09:07:43