我在查詢BigQuery上的github公共數據集。目前,我所需要的最佳查詢如下所示。如何從BigQuery中獲取多個列?
SELECT type, created_at, repository_name FROM [githubarchive:github.timeline]
WHERE
(created_at CONTAINS '2012-')
AND repository_owner="twitter"
ORDER BY created_at, repository_name;
這給了我所有的事件爲所有存儲庫,這個用戶擁有從repository_owner的twitter(或任何其他用戶)(「類型」)(「repository_name」),但在一列。
不過,我真正想要的是讓所有的事件在列(「類型」),爲每個庫(「repository_name」)一列,或多或少是這樣的:
bootstrap commons twui
WatchEvent PushEvent PushEvent
WatchEvent WatchEvent PushEvent
時間戳(「created_at」)只作爲一個排序機制。這些列不一定需要等長,並且單行上的事件不需要同時發生。
我會用這個把事件放到R包的TraMineR中來做序列分析。
我該如何做到這一點?
沒有,它仍然只創建一個列。另外,出於我的目的,數據按「created_at」排序以便表示時間軸至關重要。 – histelheim 2012-08-09 11:42:11