0
我想下載維基百科上的單個文章的整個修訂歷史記錄,但遇到了障礙。下載維基百科頁面的整個歷史記錄
這是很容易下載整個維基百科的文章,或搶使用Special:Export URL參數的歷史片段:
curl -d "" 'https://en.wikipedia.org/w/index.php?title=Special:Export&pages=Stack_Overflow&limit=1000&offset=1' -o "StackOverflow.xml"
當然,我可以下載整個網站包括的所有版本每篇文章從here,但這是很多兆兆字節和更多的數據比我需要。
有沒有預先建立的方法來做到這一點? (看起來好像一定有)
這是偉大的,謝謝比爾!爲了完整性,將一些示例代碼添加到答案中。 – JeffThompson
不客氣,做得好!我正要添加一些自己。 –