Возможности
Содержание
vGPU (на основе Opensource GPU-Manager)
-
Тонкое разделение ресурсов
Делит физические ядра GPU на квоты от 1 до 100. Поддерживает динамическое распределение для мультиарендных сред, таких как AI inference и виртуальные рабочие столы. -
Планирование с учётом топологии
Автоматически приоритизирует GPU, соединённые через NVLink/C2C, чтобы минимизировать задержки передачи данных между сокетами. Обеспечивает оптимальное сочетание GPU для распределённых тренировок.
pGPU (NVIDIA Device Plugin)
-
Оптимизация под NUMA
Обеспечивает сопоставление 1:1 GPU с Pod с привязкой к NUMA-узлу, снижая конкуренцию на шине PCIe для задач высокопроизводительных вычислений (HPC), таких как обучение LLM. -
Эксклюзивный доступ к оборудованию
Предоставляет полную изоляцию физического GPU через PCIe passthrough, что идеально подходит для критически важных приложений с требованием детерминированной производительности (например, обработка медицинских изображений).
MPS (NVIDIA Multi-Process Service Plugin)
-
Оптимизация задержек выполнения
Позволяет слияние CUDA-ядр между процессами, снижая задержки инференса на 30-50% для приложений реального времени, таких как видеоаналитика. -
Совместное использование ресурсов с ограничениями
Позволяет одновременное выполнение контекстов GPU с контролем вычислительных (0-100%) и памятьных лимитов на процесс через переменные окружения.