我在Azure Blob存儲中有一堆文件,它不斷獲取新文件。我想知道是否有辦法讓我首先獲取Blob中的所有數據並將其移至BigQuery,然後保持腳本或某個作業正在運行,以便將那裏的所有新數據發送到BigQuery?有沒有辦法將數據從Azure Blob連續傳輸到BigQuery?
回答
的BigQuery提供支持querying data directly from these external data sources:谷歌的Cloud Bigtable,谷歌雲存儲,谷歌驅動。不包括Azure Blob存儲。正如Adam Lydick所說,作爲一種解決方法,您可以將數據/文件從Azure Blob存儲複製到Google Cloud Storage(或其他支持BigQuery的外部數據源)。
從Azure的Blob存儲的數據複製到谷歌雲存儲,可以運行WebJobs(或Azure Functions)和BlobTriggerred WebJob可觸發功能創建或更新一個blob的時候,WebJob功能,您可以訪問BLOB內容,寫/將其上傳到Google雲端存儲。
注意:我們可以安裝此庫:Google.Cloud.Storage在客戶端代碼中進行常用操作。並且this blog解釋瞭如何在Azure函數中使用Google.Cloud.Storage sdk。
我不知道任何可以實現這一點的開箱即用(在Google的基礎架構上)。
我可能會成立一個微小的虛擬機:
- 掃描您的Azure的Blob存儲在尋找新的內容。
- 將新內容複製到GCS(或本地磁盤)。
- 定期啓動LOAD作業以將新數據添加到BigQuery。
如果用來代替Azure的Blob存儲GCS,您可以消除虛擬機,只是有一個被觸發新項目被添加到您的GCS桶(假設你的斑點是在BigQuery的知道一個形式的雲功能如何閱讀)。我認爲這是現有解決方案的一部分,您不希望修改。
謝謝,亞當!我想這就是我將要結束的事情。是的,這是現有解決方案的一部分,它不斷地將這些文件添加到Blob中,並且我無法將其更改爲直接添加到GCS。我馬上開始:) – Michael
- 1. 有沒有辦法將CKFinder連接到Azure存儲blob?
- 2. 有沒有辦法將數據從Perl傳輸到Unix命令行工具
- 3. 沒有將數據流式傳輸到BigQuery的錯誤響應
- 4. 將SQL數據庫從Azure Blob Azure上傳到SQL數據庫
- 5. 有沒有辦法將MySql數據庫連接到eclipse?
- 6. Azure:有沒有辦法緩存/重用從Azure blob存儲下載的文件?
- 7. 有沒有辦法將textarea-rows的參數從數據庫傳遞到html
- 8. 有沒有辦法將Blueimp Gallery連接到文件上傳?
- 9. 有沒有辦法從azure中獲取所有文件
- 10. 有沒有辦法從沒有JRuby的Ruby連接到H2數據庫?
- 11. 有沒有辦法將MySQL數據庫從Windows導入到Linux?
- 12. 有沒有辦法將數據從InfluxDB發送到Kafka?
- 13. 有沒有辦法將數據從word導入到R
- 14. 有沒有辦法將數據從html標籤發送到php?
- 15. 有沒有辦法檢查AWS上的日常數據傳輸?
- 16. 有沒有辦法將數據從Fragment傳遞到適配器的onBindViewHolder?
- 17. 有沒有辦法將數據從一個視圖傳遞到modalviewcontroller
- 18. 有沒有辦法將流分析輸出寫入Azure documentdb
- 19. 如何在python中將數據流式傳輸到azure塊blob
- 20. 有沒有辦法看到與C + +傳入/傳出連接?
- 21. 無法將blob從MySQL傳輸到H2
- 22. 有沒有辦法將SQL數據發送到Azure中的App Insights?
- 23. 有沒有辦法從azure數據庫中刪除blob存儲憑據以允許bacpac本地還原?
- 24. 有沒有辦法使用BigQuery從Google Analytics導出原始數據?
- 25. 有沒有辦法從MySQL連接Oracle
- 26. 有沒有辦法將鍵/值對列表轉換爲數據傳輸對象
- 27. PeerJS連接,但沒有數據傳輸
- 28. 使數據連續在節點間傳輸的有效方法
- 29. 無法將圖像上傳到Azure blob
- 30. 有沒有最好的方法將大量數據從Mysql傳輸到Mongodb?
May [this](https://www.stitchdata.com/integrations/microsoft-azure/google-bigquery/)文章可以幫助您。 –
謝謝!我注意到了,但我認爲他們的長期整合,我看到他們的訂閱(我需要傳輸的數據量)是每月500美元。我的目標是找到一個一貫免費的解決方案(但我會檢查這是否可行與這一點更多) – Michael
不幸的是,數據也不在數據庫中。它在Azure Blob存儲中,Stitch似乎不允許進行集成。 – Michael