2013-02-09 131 views
0

我正在嘗試從維基百科文章獲取修訂歷史記錄,以便我可以獲取有關引用該文章的最新更改或事件。如何從維基百科獲取文章修訂歷史

http://en.wikipedia.org/wiki/Wikipedia:Syndication提及可通過此RSS網址獲得的文章的RSS源http://en.wikipedia.org/w/index.php?title=ARTICLENAME&action=history&feed=rss

但是上面的URL沒有控制修訂歷史日期的參數。我想知道是否有更好的方式通過計算機程序獲取文章修訂歷史記錄或以任何方式調整給定的RSS網址。

回答

4

您可以使用the MediaWiki API。具體而言,the revisions module

+0

http://en.wikipedia.org/w/api.php?format=xml&action=query&prop=revisions&titles=Kader_Khan&rvlimit=20&rvdiffto=prev 執行此URL時,我會得到一些初始修訂的差異,但在以後的修訂中會失敗。 – 2013-02-10 14:19:20

+0

@ArpitAgarwal看看https://bugzilla.wikimedia.org/show_bug.cgi?id=29223,其中談到。 – svick 2013-02-10 14:51:56

0

您也可以嘗試用pywikipediabot,嘗試快照:

import wikipedia 

site= wikipedia.Site("pt", "wikipedia") 

wpage = wikipedia.Page(site, u"Portugal") 

for i in wpage.getVersionHistory(): 
    print i 
相關問題