简体中文

功能概览

vGPU（基于开源 GPU-Manager）

细粒度资源切割
将物理 GPU 核心切分为 1-100 个配额。支持动态分配，适用于 AI 推理和虚拟桌面等多租户环境。
拓扑感知调度
自动优先考虑 NVLink/C2C 连接的 GPU，以最小化跨插槽数据传输延迟。确保用于分布式训练工作负载的最佳 GPU 配对。

pGPU（NVIDIA 设备插件）

NUMA 优化分配
强制执行 1:1 GPU 与 Pod 的映射，并绑定 NUMA 节点，减少高速计算（HPC）任务（如 LLM 训练）中的 PCIe 总线争用。
独占硬件访问
通过 PCIe 直通提供完全的物理 GPU 隔离，非常适合需要确定性性能的关键任务应用程序（如医疗影像处理）。

MPS（NVIDIA 多进程服务插件）

延迟优化执行
实现跨进程的 CUDA 核心融合，减少实时应用（如视频分析）的推理延迟 30-50%。
带上限的资源共享
允许并发 GPU 上下文执行，同时通过环境变量强制每个进程的计算（0-100%）和内存限制。

以 PDF 格式查看完整文档

实用指南

架构

核心概念

功能指南

如何操作

故障排除

概念

功能指南

实用指南

故障排除

安装

核心概念

操作指南

实用指南

数据容灾

核心概念

操作指南

实用指南

操作指南

合规

安装

API Refiner

用户

功能指南

用户组

功能指南

角色

功能指南

IDP

功能指南

故障排除

用户策略

功能指南

概览

镜像

操作指南

实用指南

虚拟机

操作指南

实用指南

问题处理

网络

操作指南

实用指南

存储

操作指南

备份和恢复

操作指南

核心概念

核心概念

功能指南

Namespaces

创建应用前准备工作

创建应用

创建应用后的配置

运维

应用可观测

计算组件

Pods

容器

使用指南

安装

使用指南

安装

功能指南

How To

概念

功能指南

Argo CD 核心概念

Alauda Container Platform GitOps 核心概念

创建 GitOps 应用

GitOps 可观测

架构

操作指南

实用指南

操作指南

实用指南

问题处理

架构

操作指南