离线训练概述
更新时间:
# 离线训练
经过调试后,模型的学习能力已达到您的预期,此时您可以提交一个离线训练,喂以大量的数据让模型学习,使之经过学习最终在某方面具备近乎人的辨识能力。
在离线训练中,您可以提交单机单卡、单机多卡、多机多卡的训练,可大大提高训练速度。
优势如下
- 可提交分布式训练,大大提高训练效率。
- 训练输出在
/gemini/output/
目录可被持久保存,亦可在平台界面上查看。 - 训练结束后自动停止,避免算力浪费。
# 提交离线训练
训练方式 | 说明 |
---|---|
提交单机训练 | 支持单机单卡、单机多卡的训练。 |
提交分布式训练 | 支持多机多卡训练,该方式下您需要配置多条启动命令。 |
提交Horovod分布式训练 | 支持 Horovod 框架的分布式训练,这种方式下训练,您只需要一条启动命令。 |