2016-11-06 259 views
0

我試圖在過去五年中收集特定網頁(「比特幣」)的維基百科頁面查看統計數據的時間序列數據。我發現這個網站很有用:http://stats.grok.se獲取這些數據。兩個問題:獲取維基百科頁面查看統計信息

  1. 只要選擇2016年作爲獲取數據的年份,網站就會觸發「內部服務器錯誤」錯誤。

  2. 是否有一個現有的工具,可以把這種輸出更可用的形式,如.csv?

回答

2

我不知道stats.grok.se,因爲它似乎不住在維基媒體作品或實驗室服務器上。但有提供用於啓動2015年7月瀏覽量統計信息的API:在過去的一年

https://wikimedia.org/api/rest_v1/#!/Pageviews_data/get_metrics_pageviews_per_article_project_access_agent_article_granularity_start_end

例如,每天頁面訪問量到https://en.wikipedia.org/wiki/Bitcoinhttps://wikimedia.org/api/rest_v1/metrics/pageviews/per-article/en.wikipedia.org/all-access/all-agents/Bitcoin/daily/20151105/20161105

所有訪問=桌面+移動網絡+移動-app

所有代理用戶= +蜘蛛+機器人

歷史數據可以從https://dumps.wikimedia.org/other/pagecounts-raw/

下載
+0

這太好了!謝謝 – Parseltongue