2016-12-27 108 views
1

我試圖以XML文件的形式獲取對給定維基百科文章進行修訂的所有細節。然而,我無法完全理解它。例如,this link提供了一個只包含1000個編輯的XML。如何獲取Wikipedia文章的所有XML修訂版本?

獲取所有修訂的詳細信息是here

我用捲曲得到它,但是,我無法得到我的願望。有人使用過這種方法嗎?或者是否有其他方法來獲取包含文章所有修訂的XML或一組XML?

回答

1

您可以通過使用MediaWiki API得到所有維基百科頁面的修訂歷史:

https://en.wikipedia.org/w/api.php?action=query&format=xml&prop=revisions&rvprop=parsetree&titles=Tiger%20snake&rvlimit=500 

rvlimit50對於普通用戶來說,500用於註冊和5000的機器人。要獲得所有修訂,您需要使用前一個響應中的rvcontinue值創建一個循環。

+0

請原諒我的無知。但是我仍然無法獲得XML。當我遵循你給出的地址時,我沒有得到XML。你能指導更多嗎?例如,我想要一個具有「美國」文章修訂版的XML。謝謝 – annie

+0

@xerox你得到了什麼?鏈接不工作或...? – Termininja

+0

你能幫助我如何以及在哪裏執行上述查詢以及如何使用'rvcontinue'來獲取文章的所有修訂? – annie

相關問題