Примечания к выпуску

AI 2.0.0

Новые и оптимизированные функции

Поддержка NPU

С введением NPU Operator реализована поддержка управления аппаратным обеспечением NPU, что упрощает настройку использования NPU и повышает аппаратное ускорение.

Очередь и контроль допуска

С внедрением Alauda Build of Kueue реализовано управление очередями и контроль допуска, что оптимизирует планирование задач и распределение ресурсов.

Реестр моделей

Интеграция Kubeflow Model Registry улучшает управление моделями и контроль версий, упрощая процесс регистрации и хранения моделей.

Распределённый вывод

С добавлением llm-d теперь поддерживается распределённый вывод, что повышает производительность и эффективность использования ресурсов при масштабных задачах вывода.

Поддержка Leader-Worker Set

С введением Alauda Build of LeaderWorkerSet реализовано управление задачами распределённого обучения, упрощая распределение и координацию задач в модели Leader-Worker.

AI Gateway

Новый Alauda build of Envoy AI Gateway оптимизирует управление трафиком и безопасность, обеспечивая расширенные возможности проксирования AI-сервисов.

Оркестрация Trainer

Поддержка Kubeflow Trainer v2 улучшает планирование и управление задачами обучения моделей, обеспечивая более гибкие и эффективные рабочие процессы обучения.

Оркестрация Pipelines

Интеграция с Kubeflow Pipeline позволяет более эффективно организовывать оркестрацию пайплайнов и управление задачами, улучшая автоматизацию рабочих процессов.

Векторное хранилище

Введение Milvus обеспечивает эффективное решение для хранения векторов, поддерживая масштабируемое хранение векторных данных и быстрый поиск.

NVIDIA DRA

С внедрением NVIDIA DRA Driver for GPUs оптимизировано управление и планирование ресурсов GPU, что повышает их использование и производительность.

Node Feature Discovery

Alauda Build of Node Feature Discovery обеспечивает автоматическое обнаружение аппаратных особенностей и маркировку узлов, улучшая гибкость управления ресурсами узлов.

Llama Stack Runtime

Введение Llama Stack расширяет возможности AI-агентов, предоставляя эффективную среду выполнения для поддержки распределённых AI-задач.

Generative AI

С добавлением раздела Kserve's Generative AI расширена поддержка генеративного AI, оптимизируя развертывание моделей и вывод, особенно для приложений генеративного AI.

Интеграция Low-Code Builder

Обновление версии Dify и предоставление deployable Charts упрощают процесс создания приложений с низким кодом, дополнительно повышая эффективность разработки AI-приложений.

Устаревшие функции

Устаревание UI Fine-Tuning & Pretraining

Из-за отсутствия широкой применимости, сложности горизонтального масштабирования и того, что данный метод не является основным в индустрии для обучения и дообучения моделей, эта функция устарела. Рекомендуется использовать дообучение и обучение моделей на основе ноутбуков.

Устаревание Secret Manage

Функция Secret Manage устарела из-за отсутствия актуальных сценариев использования, так как ручная интеграция с GitLab больше не требуется и не применяется.

Исправленные ошибки

When updating the inference service resource yaml through the page, the volumeMount field is missing, which can cause the inference service to fail to start properly
In older versions, GraphQL queries (POST by default) were incorrectly intercepted by the gateway layer and checked for create permission. In the new version, requests sent to the /api/graphql interface are correctly treated as get read permissions by the RBAC interceptor, ensuring that users with read-only roles can read and access page content containing GraphQL data streams without problems.

Известные проблемы

After deleting a model, the list page fails to reflect the deletion result immediately, and the deleted model still briefly exists in the list. Temporary solution, manually refresh the page.
Modifying library_name in Gitlab by directly editing the readme file does not synchronize the model type change on the page.
Temporary solution: Use UI operation to modify the library_name to avoid direct operation in Gitlab.

#Примечания к выпуску

#Содержание

#AI 2.0.0

#Новые и оптимизированные функции

#Поддержка NPU

#Очередь и контроль допуска

#Реестр моделей

#Распределённый вывод

#Поддержка Leader-Worker Set

#AI Gateway

#Оркестрация Trainer

#Оркестрация Pipelines

#Векторное хранилище

#NVIDIA DRA

#Node Feature Discovery

#Llama Stack Runtime

#Generative AI

#Интеграция Low-Code Builder

#Устаревшие функции

#Устаревание UI Fine-Tuning & Pretraining

#Устаревание Secret Manage

#Исправленные ошибки

#Известные проблемы