2012-08-14 91 views
2

試圖從這個Google Politics Insights網頁提取數據從「一月2012年到現在的」爲羅姆尼和奧巴馬以下數據集:如何從嵌入Raphael數據集中提取數據爲CSV?

  • 搜索趨勢基於體積
  • 谷歌新聞提及提及在文章和博客文章
  • 的YouTube視頻觀看從候選頻道查看

對於視覺舉例來說,這裏就是我的意思:

enter image description here

用Firebug我能計算出的數據存儲在由拉斐爾2.1.0可讀的格式;看着數據集,並沒有什麼讓我想到將數據轉換爲CSV的簡單方法。

如何將每個總統候選人的每張圖表數據轉換爲具有「搜索趨勢」,「Google新聞提及」和「YouTube視頻觀看次數」的CSV表格,並按照最小時間增量在圖中測量的結果被設置爲「0.0至1.0」的值?(注意:「0.0到1.0」的原因是曲線看起來並不會給出音量信息,所以音量是相對於曲線本身的高度而言的。)

或者,如果所有三個CSV中的數據集,這也會起作用。

+0

正如人們只能猜測,[**這些值**](http://www.google.com/elections/data/trends/us/?hl=en&callback=jQuery172033727501635439694_1345014317767&_=1345014317916)是什麼關係,很可能使它變得非常可讀。但是我發現他們在'main.js(392行)'中有'Math.log(dataPoints [i] [j] * 100.0)/ Math.log(logScaleBase);''。因此,似乎logarithmus尚未計入數據。也許這有幫助,否則你可能會在其他地方找到其他來源。 – 2012-08-15 07:17:27

+0

@丹李:謝謝,隨時發表您的評論作爲答案,因爲它對我很有用。 – blunders 2012-08-16 03:06:21

+0

好的,謝謝,我做到了。如果需要,您可以編輯回覆以提供更多信息 – 2012-08-16 07:18:55

回答

1

要做的第一件事是找出數據來自哪裏,所以我查看了我的開發者控制檯中的網絡流量,並很快找到了它:The data is stored as json here

現在你已經有了大量的每個候選人的數據。我不確切知道這些數字是什麼關係,但他們肯定是用於他們在圖表中的調整。我發現,在main.js的位置上線392,他們計算出的數據與此表達:

Math.log(dataPoints[i][j] * 100.0)/Math.log(logScaleBase); 

我的猜測是:如果沒有對數,有點指數計算你應該得到正確的結果。