0

也可以有人列出詳細的步驟來訓練和部署Gcloud張量流模型? 我有我自己的代碼,我不想改變。看起來代碼必須採用某種剛性格式才能用於Gcloud,例如task.py文件等。如何使用雲ML來預測csv文件而不是json?

+0

歡迎來到StackOverflow。請閱讀並遵守幫助文檔中的發佈準則。 [在主題](http://stackoverflow.com/help/on-topic)和[如何提問](http://stackoverflow.com/help/how-to-ask)適用於此處。 StackOverflow不是一個設計,編碼,研究或教程服務。 – Prune

回答

0

我剛剛在2周前第一次自己經歷了這個過程。我推薦的是使用這個tutorial(由Google友善的人創建)。

我不記得遇到任何大問題,但讓我知道如果你碰到任何路障,我可能會幫助你。

從JSON的例子從上面的鏈接教程改變預測輸入到CSV,你會發現,給出的默認值是「JSON」,但可以更改爲「CSV」(source):

parser.add_argument(
     '--export-format', 
     help='The input format of the exported SavedModel binary', 
     choices=['JSON', 'CSV', 'EXAMPLE'], 
     default='JSON' 
) 

這意味着您可以在創建模型時指定--export-format 'CSV'。例如:

python trainer/task.py \ 
--train-files ~/Documents/data/adult.data.csv \ 
--eval-files ~/Documents/data/adult.test.csv \ 
--job-dir ~/Documents/models/census/v1 \ 
--train-steps 100 \ 
--verbosity 'DEBUG' \ 
--export-format 'CSV' 
0

讓我看看我能否幫助您 - 這可能需要後續問題(這是值得歡迎的),超越了這個高層次的答案。

首先閱讀文檔 - 希望您已經看過https://cloud.google.com/ml-engine/docs/how-tos/training-steps哪些鏈接到與此處相關的各種主題。

讓我試着總結一些你想記住的關鍵事項。

  1. 在很高層次上,您需要編寫一個接受一組命令行參數的Python程序,因此該接口相當一般。你不需要命名task.py。

  2. 您確實需要打包Python代碼以及聲明依賴關係,以便在您的作業在雲上運行時安裝它們。 (請參閱https://cloud.google.com/ml-engine/docs/how-tos/packaging-trainer

  3. 在分佈式培訓的情況下,您需要使用TF_CONFIG環境變量實例化TensorFlow服務器,以便與作業中的其他工作人員進行協調。看到這個https://cloud.google.com/ml-engine/docs/concepts/trainer-considerations

  4. 當你使用gcloud工具提交你的工作時,你需要指定一個集羣配置。

  5. 在雲中,您需要閱讀培訓數據,並將檢查點,摘要和生成的模型寫入雲存儲,而不是本地磁盤(即瞬態)。 TensorFlow在其文件I/O API中支持GCS。見https://cloud.google.com/ml-engine/docs/how-tos/working-with-data

  6. 最後,當你製作一個模型,用於部署/預測與ML引擎(如果需要),然後確保你使用SavedModel的API - https://cloud.google.com/ml-engine/docs/how-tos/deploying-models

希望這有助於給你一個廣泛的概述。

另一件有用的事情是理解你的代碼 - 它是基於低級別的TensorFlow API嗎?還是基於Estimators?後者簡化了許多方面(尤其是分佈式培訓)。

+0

我已閱讀文檔。我覺得我無法很好地解析它。根據我的理解: 1)通過調用「gcloud ml-engine作業提交培訓 - 軟件包路徑= ....」命令,可以讓gcloud很好地打包代碼。 我現在面臨的問題是這樣的:我的項目的 文件夾結構如下: 父文件夾:MY_PROJECT 子文件夾:MY_PROJECT /碼,MY_PROJECT /數據,MY_PROJECT /型號 顯然,我的包路徑是MY_PROJECT /代碼。但是,當我嘗試運行創建新模型的文件夾中的主代碼時,gcloud表示code/code_to_be_run.py不存在 –

+0

您是否在my_project目錄中創建了setup.py文件?然後將gcloud指向您的my_project目錄。 –

+0

是的。有一個setup.py文件。它仍然說「沒有名爲code/code_to_be_run.py的模塊」 –

相關問題