也可以有人列出詳細的步驟來訓練和部署Gcloud張量流模型? 我有我自己的代碼,我不想改變。看起來代碼必須採用某種剛性格式才能用於Gcloud,例如task.py文件等。如何使用雲ML來預測csv文件而不是json?
回答
我剛剛在2周前第一次自己經歷了這個過程。我推薦的是使用這個tutorial(由Google友善的人創建)。
我不記得遇到任何大問題,但讓我知道如果你碰到任何路障,我可能會幫助你。
從JSON的例子從上面的鏈接教程改變預測輸入到CSV,你會發現,給出的默認值是「JSON」,但可以更改爲「CSV」(source):
parser.add_argument(
'--export-format',
help='The input format of the exported SavedModel binary',
choices=['JSON', 'CSV', 'EXAMPLE'],
default='JSON'
)
這意味着您可以在創建模型時指定--export-format 'CSV'
。例如:
python trainer/task.py \
--train-files ~/Documents/data/adult.data.csv \
--eval-files ~/Documents/data/adult.test.csv \
--job-dir ~/Documents/models/census/v1 \
--train-steps 100 \
--verbosity 'DEBUG' \
--export-format 'CSV'
讓我看看我能否幫助您 - 這可能需要後續問題(這是值得歡迎的),超越了這個高層次的答案。
首先閱讀文檔 - 希望您已經看過https://cloud.google.com/ml-engine/docs/how-tos/training-steps哪些鏈接到與此處相關的各種主題。
讓我試着總結一些你想記住的關鍵事項。
在很高層次上,您需要編寫一個接受一組命令行參數的Python程序,因此該接口相當一般。你不需要命名task.py。
您確實需要打包Python代碼以及聲明依賴關係,以便在您的作業在雲上運行時安裝它們。 (請參閱https://cloud.google.com/ml-engine/docs/how-tos/packaging-trainer)
在分佈式培訓的情況下,您需要使用TF_CONFIG環境變量實例化TensorFlow服務器,以便與作業中的其他工作人員進行協調。看到這個https://cloud.google.com/ml-engine/docs/concepts/trainer-considerations
當你使用gcloud工具提交你的工作時,你需要指定一個集羣配置。
在雲中,您需要閱讀培訓數據,並將檢查點,摘要和生成的模型寫入雲存儲,而不是本地磁盤(即瞬態)。 TensorFlow在其文件I/O API中支持GCS。見https://cloud.google.com/ml-engine/docs/how-tos/working-with-data
最後,當你製作一個模型,用於部署/預測與ML引擎(如果需要),然後確保你使用SavedModel的API - https://cloud.google.com/ml-engine/docs/how-tos/deploying-models
希望這有助於給你一個廣泛的概述。
另一件有用的事情是理解你的代碼 - 它是基於低級別的TensorFlow API嗎?還是基於Estimators?後者簡化了許多方面(尤其是分佈式培訓)。
我已閱讀文檔。我覺得我無法很好地解析它。根據我的理解: 1)通過調用「gcloud ml-engine作業提交培訓 - 軟件包路徑= ....」命令,可以讓gcloud很好地打包代碼。 我現在面臨的問題是這樣的:我的項目的 文件夾結構如下: 父文件夾:MY_PROJECT 子文件夾:MY_PROJECT /碼,MY_PROJECT /數據,MY_PROJECT /型號 顯然,我的包路徑是MY_PROJECT /代碼。但是,當我嘗試運行創建新模型的文件夾中的主代碼時,gcloud表示code/code_to_be_run.py不存在 –
您是否在my_project目錄中創建了setup.py文件?然後將gcloud指向您的my_project目錄。 –
是的。有一個setup.py文件。它仍然說「沒有名爲code/code_to_be_run.py的模塊」 –
- 1. 如何從BigQuery而不是Cloud ML中的csv文件進行培訓?
- 2. 使用JSON文件,而不是在CSV d3.js餅圖
- 3. 如何使用json格式而不是csv使用d3?
- 4. 如何在雲上運行雲ML預處理?
- 5. Azure ML未來預測算法
- 6. 如何加載spark.mllib模型而不使用SparkContext來預測?
- 7. 使用NLP/ML/word2vec/tensorflow進行預測
- 8. 如何星火預測值ML
- 9. 而不是保存CSV文件如何下載文件
- 10. Azure銷售預測ML
- 11. 雲ML Python SDK文檔
- 12. D3.js - 如何使用內聯JSON作爲D3圖表的數據集,而不是csv/tsv/json文件
- 13. 如何使用RazorGenerator而不是T4來生成C#文件?
- 14. 如何使用$ http.get加載內部json而不是外部JSON文件
- 15. 有什麼辦法來創建CSV文件,而不是使用python
- 16. 使用VBA或Excel而不使用「DIR」來測試文件是否存在
- 17. csv文件顯示,而不是下載
- 18. PHP文件 - 導出XLS,而不是CSV
- 19. 如何加載一個JSON對象,而不是JSON文件
- 20. 保存模型預測爲csv文件
- 21. 如何將CSV轉換爲JSON而不使用JSONArray?
- 22. PHP導出爲CSV而不是JSON
- 23. 的Rails:SEND_DATA(CSV)把對象ID CSV文件,而不是CSV信息
- 24. Java創建api來暴露csv而不是json
- 25. 使用JSON而不是MySQL?
- 26. pyparsing使用分號而不是逗號分析csv文件
- 27. 如何在gcloud ml-engine中上傳批量預測的輸入文件?
- 28. 如何使用liblinearutil包來訓練和預測python中的測試文件?
- 29. 使用Javascript來檢測真實文本,而不是HTML標記
- 30. 如何使用TensorFlow將預測值添加到CSV文件中的空白列?
歡迎來到StackOverflow。請閱讀並遵守幫助文檔中的發佈準則。 [在主題](http://stackoverflow.com/help/on-topic)和[如何提問](http://stackoverflow.com/help/how-to-ask)適用於此處。 StackOverflow不是一個設計,編碼,研究或教程服務。 – Prune