我爲Streaming Data Into BigQuery使用google-api-ruby-client
。所以只要有請求。它作爲隊列被推入Redis &然後新的Sidekiq工作人員嘗試插入到bigquery中。我認爲它涉及到每插入一個新的HTTPS連接到bigquery。Bigquery流插入,每個插入持久或新的http連接?
我的設置是: 事件每隔1秒發佈一次或批量大小達到1MB(1兆字節)時,以先發生者爲準。這是每個工作人員,因此Biquery API可能會在多個HTTPS連接上每秒接收數十個HTTP帖子。
這是使用Google提供的API客戶端完成的。
現在的問題 - 對於流插入,什麼是更好的方法: -
- 持續HTTPS連接。如果是的話,那麼它應該是一個全局連接,並在所有請求之間共享?或者是其他東西?
- 打開新的連接。就像我們現在正在使用的那樣
google-api-ruby-client