我已經上傳了10,000個觀察值(也用20 + 1和100 + 1)的變量,所有變量都是二進制(0,1),除了weight(float)並執行一些簡單的查詢,如:查詢bigquery需要更多時間
SELECT sum(col1),sum(wt*col1),sum(col2),sum(wt*col2),sum(col3),sum(wt*col3),sum(col4),sum(wt*col4),sum(col5),sum(wt*col5),sum(col6),sum(wt*col6)
,sum(col7),sum(wt*col7),sum(col8),sum(wt*col8),sum(col9),sum(wt*col9),sum(col10),sum(wt*col10)
FROM [bigquery_dummy_dataset.bin_006b];
這個查詢花費5.6 secs approx
在執行它100 columns is taking 21 secs approx
。我感覺它比其他現有的數據庫技術慢(在sql server中通過使用索引我們已經實現了更高的性能)。但是,我想處理更多的數據(最多2000個變量)。
我做錯了什麼?有什麼辦法可以加快流逝的時間?