2013-04-14 25 views
3

我感興趣的是得到github上回購的數量爲一組特定的語言github回購按語言(和歷史數據)計數? (有可能的話歷史數據)

這件事情我一直在努力,開始收集統計自己:

  1. 屏幕抓取頁面,如:

https://github.com/search?q=language%3Aperl&type=&ref=simplesearch

  1. 使用GitHub的API:

https://api.github.com/legacy/repos/search/KEYWORD?language=perl

但不幸的是,這似乎需要一個關鍵字得到任何結果。另外,我只需要一個數量不是每個回購的元數據。

我對歷史數據也很感興趣,看起來這些統計數據可能已經在某處可用。

有關通過語言和/或歷史數據更好地獲取回購計數的任何想法?

+1

你可以通過使用谷歌的BigQuery和http://gitarchive.com/ –

+0

得到這些謝謝 - 但gitarchive.com不存在 - 可能是一個錯字? – ErikR

+3

嗯,是我的錯:你應該使用谷歌的BigQuery和http://githubarchive.org/ –

回答

4

你可以試試這個: https://api.github.com/search/repositories?q=language:Python

此外,您還可以查詢github archive。 使用大的查詢界面,查詢應該是:

bq query 'SELECT repository_language, count(repository_language) as pushes 
FROM [githubarchive:github.timeline] 
WHERE type="CreateEvent" and repository_fork == "false" 
GROUP BY repository_language 
ORDER BY pushes DESC' 

此查詢生成每種語言回購數量的統計。