Возможности

Содержание

vGPU (на основе Opensource GPU-Manager)

  • Тонкое разделение ресурсов
    Делит физические ядра GPU на квоты от 1 до 100. Поддерживает динамическое распределение для мультиарендных сред, таких как AI inference и виртуальные рабочие столы.

  • Планирование с учётом топологии
    Автоматически приоритизирует GPU, соединённые через NVLink/C2C, чтобы минимизировать задержки передачи данных между сокетами. Обеспечивает оптимальное сочетание GPU для распределённых тренировок.

pGPU (NVIDIA Device Plugin)

  • Оптимизация под NUMA
    Обеспечивает сопоставление 1:1 GPU с Pod с привязкой к NUMA-узлу, снижая конкуренцию на шине PCIe для задач высокопроизводительных вычислений (HPC), таких как обучение LLM.

  • Эксклюзивный доступ к оборудованию
    Предоставляет полную изоляцию физического GPU через PCIe passthrough, что идеально подходит для критически важных приложений с требованием детерминированной производительности (например, обработка медицинских изображений).

MPS (NVIDIA Multi-Process Service Plugin)

  • Оптимизация задержек выполнения
    Позволяет слияние CUDA-ядр между процессами, снижая задержки инференса на 30-50% для приложений реального времени, таких как видеоаналитика.

  • Совместное использование ресурсов с ограничениями
    Позволяет одновременное выполнение контекстов GPU с контролем вычислительных (0-100%) и памятьных лимитов на процесс через переменные окружения.