持久化存储
更新时间:
本节为您介绍,什么是持久化存储,以及哪些业务会消耗持久化存储。
# 概念
持久化存储
指可长期稳定的存储。相较临时存储,持久化存储不受环境启停等非用户意愿的因素影响,除非您自己删除或修改,否则数据将会以您最后一次保存的形态一直存储着,主要用于存储您的业务数据如:代码、AI 数据集、AI 模型、训练结果、镜像。
免费存储额度
平台为每个空间免费提供 50G 持久化存储额度,供您在平台创建体验以熟悉平台,空间内存储用量超过该额度时将产生存储费用。
# 存储计费
参见计费规则-持久化存储计费。
# 存储清理
参见 平台计费-数据清理。
# 持久化存储使用
# 代码存储
项目中您用于训练或调试的代码存放于持久化存储中。
- 写入方式:本地上传、通过开发环境写入
- 挂载路径:
/gemini/code/
(可读可写) - 用量统计:累加各版本代码文件大小
- 用量查看:项目代码 页,切换各版本可查看其对应的文件大小。
# 数据集存储
用于训练模型的数据,平台对其提供数据管理的能力,您创建并上传的数据集、从代码或训练结果中导出的数据集都将存放于持久化存储中。
- 写入方式:本地上传、从代码导出数据、从结果导出数据
- 挂载路径:
/gemini/data-1/
、/gemini/data-2/
、/gemini/data-3/
(挂载后均为只读) - 用量统计:各版本数据大小 + 暂存版的增量大小
- 用量查看:
①平台 数据 页中,数据卡片的右下角。
②单击数据卡片,进入该数据集的 数据详情 页,详情页左上角。
# 模型存储
上传到平台中备用的模型,或训练结果中导出的模型,均存放于平台的持久化存储中。
- 写入方式:本地上传、从代码导出模型、从结果导出模型
- 挂载路径:
/gemini/pretrain/
、/gemini/pretrain2/
、/gemini/pretrain3/
(挂载后均为只读) - 用量统计:各版本数据大小 + 暂存版的增量大小
- 用量查看:平台 模型 模块中,进入各模型的 模型详情 页可查看其存储用量。
# 结果集存储
离线训练时输出到 /gemini/output/
目录中的信息,其存放于持久化存储中。
- 写入方式:离线训练输出
- 挂载路径:
/gemini/output/
(可读可写,但仅在离线训练时为持久化存储,开发环境中为临时存储) - 存储用量:按结果集的真实输出统计
- 用量查看:项目 结果 中,切换各结果集可在顶部查看其存储用量。
# 镜像存储
镜像用于初始化开发环境、提供离线训练环境,您保存或制作的镜像会存放于持久化存储中,官方镜像不占用持久化存储。
- 写入方式:保存环境为镜像
- 挂载路径:不涉及
- 存储用量:按各镜像真实大小统计
- 用量查看:镜像 页中,各镜像卡片上 压缩后大小 即为该镜像的存储用量,官方镜像不占用持久化存储。