持久化存储

更新时间:

本节为您介绍,什么是持久化存储,以及哪些业务会消耗持久化存储。

# 概念

持久化存储
指可长期稳定的存储。相较临时存储,持久化存储不受环境启停等非用户意愿的因素影响,除非您自己删除或修改,否则数据将会以您最后一次保存的形态一直存储着,主要用于存储您的业务数据如:代码、AI 数据集、AI 模型、训练结果、镜像。

免费存储额度
平台为每个空间免费提供 50G 持久化存储额度,供您在平台创建体验以熟悉平台,空间内存储用量超过该额度时将产生存储费用。

# 存储计费

参见计费规则-持久化存储计费

# 存储清理

参见 平台计费-数据清理

# 持久化存储使用

# 代码存储

项目中您用于训练或调试的代码存放于持久化存储中。

  • 写入方式:本地上传、通过开发环境写入
  • 挂载路径:/gemini/code/ (可读可写)
  • 用量统计:累加各版本代码文件大小
  • 用量查看:项目代码 页,切换各版本可查看其对应的文件大小。

# 数据集存储

用于训练模型的数据,平台对其提供数据管理的能力,您创建并上传的数据集、从代码或训练结果中导出的数据集都将存放于持久化存储中。

  • 写入方式:本地上传从代码导出数据从结果导出数据
  • 挂载路径:/gemini/data-1//gemini/data-2//gemini/data-3/(挂载后均为只读)
  • 用量统计:各版本数据大小 + 暂存版的增量大小
  • 用量查看:
    ①平台 数据 页中,数据卡片的右下角。

    ②单击数据卡片,进入该数据集的 数据详情 页,详情页左上角。

# 模型存储

上传到平台中备用的模型,或训练结果中导出的模型,均存放于平台的持久化存储中。

  • 写入方式:本地上传从代码导出模型从结果导出模型
  • 挂载路径:/gemini/pretrain//gemini/pretrain2//gemini/pretrain3/ (挂载后均为只读)
  • 用量统计:各版本数据大小 + 暂存版的增量大小
  • 用量查看:平台 模型 模块中,进入各模型的 模型详情 页可查看其存储用量。

# 结果集存储

离线训练时输出到 /gemini/output/ 目录中的信息,其存放于持久化存储中。

  • 写入方式:离线训练输出
  • 挂载路径:/gemini/output/ (可读可写,但仅在离线训练时为持久化存储,开发环境中为临时存储)
  • 存储用量:按结果集的真实输出统计
  • 用量查看:项目 结果 中,切换各结果集可在顶部查看其存储用量。

# 镜像存储

镜像用于初始化开发环境、提供离线训练环境,您保存或制作的镜像会存放于持久化存储中,官方镜像不占用持久化存储。

  • 写入方式:保存环境为镜像
  • 挂载路径:不涉及
  • 存储用量:按各镜像真实大小统计
  • 用量查看:镜像 页中,各镜像卡片上 压缩后大小 即为该镜像的存储用量,官方镜像不占用持久化存储。