概述
更新时间:
在 AI 训练中,推理服务是指利用已经训练好的机器学习模型,根据新的输入数据来生成预测结果的服务。
- 在创建完项目后,您可直接点击 推理 进入推理服务页面,创建提交推理服务。
- 在项目开发环境内完成调试后,可将保存的镜像或制作标准镜像在推理服务中使用。
- 在训练完成后,您也可以将任务结果或手动导出的模型用于部署推理服务,对新的数据进行预测和推断以检验模型的能力。
训练是为了得到一个性能良好的模型,而推理服务则是模型价值的体现。同时,推理服务的反馈也可以帮助指导模型的进一步训练和优化。
# 优势
- 部署快捷 :支持从项目内的任意AI资产(镜像、模型、数据集)创建推理服务,交互操作更加便捷高效。
- 高并发 :支持创建多个副本,满足高并发场景需求。
- 稳定性强 :支持设置目标副本数,在副本因意外停服时,支持自动拉起副本,保障服务更加稳定。
- 节省资源 :支持扩缩容,可轻松应对业务请求量的变化,节省资源。
# 推理服务功能
支持功能 | 说明 |
---|---|
升级推理服务 | 支持在推理运行中进行升级,即滚动升级推理服务,也可在停止时更新推理服务。 |
回滚推理服务 | 平台会将历史配置存为老版本,支持一键点击回滚到老版本。 |
手动扩缩容 | 支持在推理服务中手动修改副本数。 |
定时扩缩容 | 支持设置定时扩缩容策略来修改副本数。 |
副本的监控服务 | 在推理服务概述页面和右侧边栏监控处可选择副本并查看副本状态。 |
调用推理服务 | 支持在服务运行时,通过平台提供的外部访问地址,访问推理服务。 |