谷歌雲平臺架構

是通過谷歌查詢大存儲處理，在谷歌雲存儲，並只用於分割目的吉貝數據？或者Google Big Query是否擁有自己的存儲機制。

我在學習架構，我看到箭頭互相指向，但它沒有說GBQ的架構在哪裏？

謝謝。

2017-08-10 arcee123

巨像 - 分佈式存儲

的BigQuery依靠巨人，谷歌最新一代的分佈式文件系統。每個Google數據中心都有自己的Colossus羣集，並且每個Colossus羣集都有足夠的磁盤，以便每次爲每個BigQuery用戶提供數千個專用磁盤。 Colossus還處理複製，恢復（當磁盤崩潰時）和分佈式管理（因此沒有單點故障）。 Colossus足夠快到允許BigQuery提供與許多內存中的數據庫類似的性能，但利用了更便宜但高度並行化的，可伸縮，耐用和高性能的基礎架構。

BigQuery中利用了ColumnIO柱狀存儲格式和壓縮算法來以最佳方式在巨人數據存儲用於讀取大量結構化data.Colossus的允許大量查詢用戶擴展到幾十PB的在存儲無縫，而無需支付附加更昂貴的計算資源的代價 - 大多數傳統數據庫都是這種情況。

關於ColumnIO的部分已過時--BigQuery現在使用Capacitor format - 但其餘部分仍然相關。

來源

2017-08-10 20:42:46

是巨人一個谷歌雲存儲的東西？意思是它用在兩者上？還是GCS和Colossus之間的獨立架構？ – arcee123

[GCS建立在巨像之上]（https://cloudplatform.googleblog.com/2014/01/easier-faster-lower-cost-big-data-processing-with-the-google-cloud-storage-connector - 用於-hadoop.html）。 Colossus爲Google自己的服務提供了一個較低級別的存儲API。 –

謝謝！這是我需要知道的一件事。 – arcee123

谷歌雲平臺架構

回答

相關問題