我試圖在過去五年中收集特定網頁(「比特幣」)的維基百科頁面查看統計數據的時間序列數據。我發現這個網站很有用:http://stats.grok.se獲取這些數據。兩個問題:獲取維基百科頁面查看統計信息
只要選擇2016年作爲獲取數據的年份,網站就會觸發「內部服務器錯誤」錯誤。
是否有一個現有的工具,可以把這種輸出更可用的形式,如.csv?
我試圖在過去五年中收集特定網頁(「比特幣」)的維基百科頁面查看統計數據的時間序列數據。我發現這個網站很有用:http://stats.grok.se獲取這些數據。兩個問題:獲取維基百科頁面查看統計信息
只要選擇2016年作爲獲取數據的年份,網站就會觸發「內部服務器錯誤」錯誤。
是否有一個現有的工具,可以把這種輸出更可用的形式,如.csv?
我不知道stats.grok.se,因爲它似乎不住在維基媒體作品或實驗室服務器上。但有提供用於啓動2015年7月瀏覽量統計信息的API:在過去的一年
例如,每天頁面訪問量到https://en.wikipedia.org/wiki/Bitcoin:https://wikimedia.org/api/rest_v1/metrics/pageviews/per-article/en.wikipedia.org/all-access/all-agents/Bitcoin/daily/20151105/20161105
所有訪問=桌面+移動網絡+移動-app
所有代理用戶= +蜘蛛+機器人
下載我發現網頁瀏覽統計信息的存檔2007至2016年在這裏:https://dumps.wikimedia.org/other/pagecounts-raw/
在頁面的底部,他們列出一些其他來源涵蓋了各個時間段。
這太好了!謝謝 – Parseltongue