我正在嘗試處理Github數據挑戰的入口,並試圖分析一組PushEvent,但我得到了一些奇怪的(?)結果。解析githubarchive響應
users = Hash.new(0)
(0..23).each do |hour|
gz = open("http://data.githubarchive.org/2013-04-01-#{hour}.json.gz")
js = Zlib::GzipReader.new(gz).read
Yajl::Parser.parse(js) do |event|
if event["type"] == "PushEvent" && event["actor_attributes"] && event["actor_attributes"]["login"]
users[event["actor_attributes"]["login"]] += 1
end
end
end
這個腳本工作,正常,但當我通過
users.values.max
看看最提交了幾次由我一個人看到有人制作了超過7K一天提交。當我經過,並打印出
event["payload"]["shas"]
所有的打印結果的基本相同:
585a2f02f36da9ee0625a42aa2d5e98836c8a2de
[email protected]
Notes added by 'git notes add'
Jenkins
true
我相信,隨着PushEvent相關的提交信息是「通過「git的筆記添加註釋添加'「,這似乎是正確的?或者我在這裏誤讀了一些數據?