我想了解谷歌的Big query和Azure數據Lake U-SQL之間的差異或優缺點。哪個更好 ?我詳盡地搜索了最大的區別是什麼,但無法找到它。Google的BigQuery與Azure數據湖U-SQL
1
A
回答
5
好的,這裏有兩種技術之間的一些基本區別。
數據外形
- 谷歌大查詢 - 他們請你把數據轉換爲一定 形狀,如JSON,CSV或Avro公司。
- 數據湖泊 - 他們只是要求你轉儲你在湖中的任何東西,並且你可以在其上運行usql查詢。
數據大小
谷歌大查詢擁有超過文件大小限制 - https://cloud.google.com/bigquery/loading-data-into-bigquery#quota雖然他們是相當大的限制
數據湖 - 擁有超過文件大小正式沒有限制,你實際上可以從一個PB字節文件開始。
最大的區別在於查詢模型,但在此之前必須知道您還可以在Azure數據存儲庫上運行HBase工作負載,而HBase實際上是谷歌大表的開源實現,其他許多細微之處您可以在這裏看到的差異http://www.larsgeorge.com/2009/11/hbase-vs-bigtable-comparison.html。
谷歌大查詢本身不是一個編譯查詢,而USQL是SQL語法和CLR功能的組合,USQL查詢首先被編譯,然後運行在數據存儲上,這允許一個人編寫自定義函數與他們的查詢一起使用來解析或處理差異形式的數據。 甚至可以使用Azure數據湖工具可視化USQL查詢的執行計劃。 Big query和USQL都很容易理解和使用。
認證
- 谷歌大查詢有標準的API認證 https://cloud.google.com/bigquery/authentication
- ADL - 應用程序和用戶身份驗證通過Azure的AD控制。
作爲一個大數據平臺都要求尊重,但我個人認爲Azure的數據湖爲更好的實現,因爲它允許靈活地使用開源項目,如火花,風暴,蜂巢,豬等工作,而大表將您的功能限制在Google生態系統中。
連接與我在我的Twitter手柄@brijrajsingh,如果你可以把它做在GIDS班加羅爾下降的,我提供一個關於4月29日的數據湖泊會話年,2016年
相關問題
- 1. 更新在USQL Azure的數據湖
- 2. azure數據湖授權
- 3. Azure數據湖與數據工廠定製活動的連接
- 4. 使用Azure的數據湖的分析
- 5. Azure數據湖中的U-SQL遊標
- 6. Azure數據湖中的增量負載
- 7. CreateJob for C#的Azure數據湖分析#
- 8. 我們能否使用Snappy-data更新Azure數據湖中的記錄? OR僅僅是Azure數據湖追加?
- 9. Usql與Azure Data Lake Store .net SDK
- 10. 如何將Azure數據湖存儲連接到Azure ML?
- 11. Azure數據湖外部數據源:行大小太大
- 12. 如何將流數據保存到Azure數據湖?
- 13. 如何從多線程寫入流數據到Azure數據湖?
- 14. 電力BI刷新數據源Azure數據湖
- 15. 使用azure數據湖的polybase的基準測試
- 16. Azure的數據湖店通過C#腳本
- 17. Azure的數據分析湖得到IOutputter輸出文件名
- 18. 如何從Azure的數據副本湖加快宇宙DB
- 19. U型SQL(Azure的數據湖語言)腳本錯誤
- 20. BigQuery中的Google Analytics數據(timeOnPage&searchStartPage)
- 21. 通配符在數據工廠Azure的數據存儲湖輸入
- 22. Azure Web Job從數據湖店下載的數據不好編碼
- 23. Azure中的Google Analytics數據
- 24. Google Cloud上的ETL - (數據流與Spring批處理) - > BigQuery
- 25. 天青數據湖:加密
- 26. Google BigQuery添加/更新數據
- 27. 將數據從Google Spreadsheets寫入BigQuery表
- 28. Google BigQuery日期數據類型?
- 29. 將數據從MicrosoftSQLServer上傳到Google BigQuery
- 30. 從Google Cloud BigQuery中讀取數據
AFAIK你不能USQL查詢上運行實木複合地板文件尚未正式支持。 – chhantyal