人工智能开发推理一站式平台,定义完整的深度学习模型开发、推理全过程,帮助客户高效完成模型从生产到推理上线的全过程。
支持独享、共享、弹性等多种算力供给,将算力资源利用率进一步提升20%
通过集群拓扑感知能力提升算力效率,多卡GPU加速比平均可达90%以上
集成高性能推理服务框架,大模型推理服务速度最大提升300%
端到端AI开发,更快投入生产
推理服务标准化,为应用提供标准、安全的推理服务部署、访问和管理
全面精确监控集群状态与算力用量,简化集群运维和用量统计工作
针对资源故障等异常情况,自动容错处理,断点续训,有效资源使用时间占比达90%
精细化控制角色权限范畴,达到安全可控、权责清晰的效果
从平台架构、网络、服务层面保障租户的数据、算法、应用的资产安全
丰富的API简化与企业系统对接标准化
集成外部工具链,高效协同和敏捷支撑业务
内置标注工具,实现多种类型数据标注
模块 | 功能项 | 描述 |
模型开发 | 开发环境 | 快速构建交互式AI开发环境,能够以Jupyter、Webshell等在线环境进行交互开发 |
算法管理 | 通过对算法的增删改,实现对算法的统一管理 | |
工作流管理 | 通过创建一系列子任务的方式,实现AI开发的业务编排 | |
服务部署 | 模型部署 | 基于模型、镜像、Yaml文件等部署方式,实现对大模型的统一部署 |
服务扩缩容 | 通过设置服务实例的上下限,实现服务的弹性扩缩容 | |
数据管理 | 数据管理 | 通过文件管理和数据集管理,实现对数据的统一管理 |
镜像管理 | 镜像管理 | 以卡片视图,统一管理镜像文件 |
监控告警 | 监控告警 | 以集群、节点等查看集群整体运行情况,可不同层级的监控信息和告警策略 |
报表统计 | 多维度报表 | 从集群、节点、用户等维度,统计资源使用 |
计费管理 | 计费管理 | 具备资源计费、用户充值和账单管理功能 |
系统管理 | 资源管理 | 能够按节点划分不同的资源组,实现对资源组的统一管理 |
用户管理 | 通过对用户、用户组和角色的增删改,实现对平台用户的灵活管理 |
有任何关于驱动、固件、手册等售后问题,请发邮件给我们:
7*24小时服务邮箱service@maginfra.com