可以访问发版说明示例查看对应文档的示例。
当前模型库支持两种模型类型:共享模型和私有模型。在最初的设计中,用户可以对共享模型执行某些管理操作,可能存在权限风险。
在此版本中,私有模型的功能和权限保持不变,支持完全的管理操作。共享模型的权限进行了限制和优化,具体如下:
之前,创建推理服务需要手动配置许多相互依赖的参数。这种复杂性常常导致错误,降低成功率,并影响用户体验。
在此版本中,引入了模板发布能力,用户可以将经过验证的配置封装为模板,并快速基于这些模板发布推理服务。
其好处包括:
之前,部署在单节点上的推理服务仅支持单GPU模式,由于资源调度限制。这限制了大型模型推理场景并未充分利用GPU资源。
随着此次升级,现支持单节点内的多GPU调度。单个推理服务可以在同一台机器上自动分配多个GPU,从而支持更大模型的推理,更好地利用资源,并增强服务能力。
之前的推理服务仅显示基本信息。为了增强可观察性,使用户能够快速检测问题、实时监测服务健康状况并主动优化或调整资源,推出以下新功能:
监控仪表盘
为增强AML推理运行时支持,在此版本中新增以下运行时:
之前,平台管理功能(包括命名空间管理和凭证管理)混合于一个视图中,因权限级别混杂而导致的混淆。
在此版本中:
之前,在引导一个命名空间时,用户必须手动配置GitLab Token以授权对仓库的访问。
此次版本通过实现自动GitLab Token配置优化了GitLab授权流程:
在AML平台迭代过程中,一些模块作为α特性发布,以探索验证设计和用户需求。
然而,由于大型模型开发场景快速变化以及用户需求的演变,一些α特性存在设计缺陷或适用性有限。这些特性将进行重新评估,并降级至S2阶段以作未来规划。
以下特性被降级:
修复问题列表可以通过文档框架提供的 release-notes-for-bugs
组件自动根据 JIRA 问题生成。
和修复问题相同,通过文档框架提供的 release-notes-for-bugs
组件自动根据 JIRA 问题生成。