GCS有幾種不同的方式從你的桶中下載文件。您可以使用控制檯和雲存儲瀏覽器。步驟:打開存儲瀏覽器,導航到要下載的對象,右鍵單擊並保存到您選擇的本地文件夾。如果您使用Chrome,保存將顯示爲「將鏈接另存爲...」。
要使用GS工具,使用這個命令:
`gsutil cp gs://[BucketName]/[ObjectName] [ObjectDestination]`.
或者你可以使用客戶端庫或REST API的下載文件。有了這些最後的選項,你可以使用一些文件或創建一個工作來下載它們。一旦它們位於Clover ETL已知的位置,該過程就很簡單。
在Clover designer中,在導航窗格下,您可以右鍵單擊一個文件夾並選擇導入。選擇你放置你的GCS文件的那個。一旦文件被導入,你就可以像使用Clover中的其他數據文件一樣使用它的數據。由於這是一個.csv文件,請記住編輯元數據(右鍵單擊組件,選擇提取元數據,然後在元數據編輯器中編輯 - 對於數據類型,標籤等)。將元數據分配給組件邊緣,以便他們知道什麼是進入/退出該步驟。根據您的文件,此過程可能會重複多次。
即使使用ETL工具,正確獲取數據和數據類型也可能非常棘手。如果您對如何在ETL項目中配置數據類型或邊緣有疑問,wiki可能會有所幫助。網頁有additional resources可能會幫助您獲得所需的最終分析結果。