Примечания к выпуску
Содержание
AI 2.0.0Новые и оптимизированные функцииПоддержка NPUОчередь и контроль допускаРеестр моделейРаспределённый выводПоддержка Leader-Worker SetAI GatewayОркестрация TrainerОркестрация PipelinesВекторное хранилищеNVIDIA DRANode Feature DiscoveryLlama Stack RuntimeGenerative AIИнтеграция Low-Code BuilderУстаревшие функцииУстаревание UI Fine-Tuning & PretrainingУстаревание Secret ManageИсправленные ошибкиИзвестные проблемыAI 2.0.0
Новые и оптимизированные функции
Поддержка NPU
С введением NPU Operator реализована поддержка управления аппаратным обеспечением NPU, что упрощает настройку использования NPU и повышает аппаратное ускорение.
Очередь и контроль допуска
С внедрением Alauda Build of Kueue реализовано управление очередями и контроль допуска, что оптимизирует планирование задач и распределение ресурсов.
Реестр моделей
Интеграция Kubeflow Model Registry улучшает управление моделями и контроль версий, упрощая процесс регистрации и хранения моделей.
Распределённый вывод
С добавлением llm-d теперь поддерживается распределённый вывод, что повышает производительность и эффективность использования ресурсов при масштабных задачах вывода.
Поддержка Leader-Worker Set
С введением Alauda Build of LeaderWorkerSet реализовано управление задачами распределённого обучения, упрощая распределение и координацию задач в модели Leader-Worker.
AI Gateway
Новый Alauda build of Envoy AI Gateway оптимизирует управление трафиком и безопасность, обеспечивая расширенные возможности проксирования AI-сервисов.
Оркестрация Trainer
Поддержка Kubeflow Trainer v2 улучшает планирование и управление задачами обучения моделей, обеспечивая более гибкие и эффективные рабочие процессы обучения.
Оркестрация Pipelines
Интеграция с Kubeflow Pipeline позволяет более эффективно организовывать оркестрацию пайплайнов и управление задачами, улучшая автоматизацию рабочих процессов.
Векторное хранилище
Введение Milvus обеспечивает эффективное решение для хранения векторов, поддерживая масштабируемое хранение векторных данных и быстрый поиск.
NVIDIA DRA
С внедрением NVIDIA DRA Driver for GPUs оптимизировано управление и планирование ресурсов GPU, что повышает их использование и производительность.
Node Feature Discovery
Alauda Build of Node Feature Discovery обеспечивает автоматическое обнаружение аппаратных особенностей и маркировку узлов, улучшая гибкость управления ресурсами узлов.
Llama Stack Runtime
Введение Llama Stack расширяет возможности AI-агентов, предоставляя эффективную среду выполнения для поддержки распределённых AI-задач.
Generative AI
С добавлением раздела Kserve's Generative AI расширена поддержка генеративного AI, оптимизируя развертывание моделей и вывод, особенно для приложений генеративного AI.
Интеграция Low-Code Builder
Обновление версии Dify и предоставление deployable Charts упрощают процесс создания приложений с низким кодом, дополнительно повышая эффективность разработки AI-приложений.
Устаревшие функции
Устаревание UI Fine-Tuning & Pretraining
Из-за отсутствия широкой применимости, сложности горизонтального масштабирования и того, что данный метод не является основным в индустрии для обучения и дообучения моделей, эта функция устарела. Рекомендуется использовать дообучение и обучение моделей на основе ноутбуков.
Устаревание Secret Manage
Функция Secret Manage устарела из-за отсутствия актуальных сценариев использования, так как ручная интеграция с GitLab больше не требуется и не применяется.
Исправленные ошибки
- When updating the inference service resource yaml through the page, the volumeMount field is missing, which can cause the inference service to fail to start properly
- In older versions, GraphQL queries (POST by default) were incorrectly intercepted by the gateway layer and checked for create permission. In the new version, requests sent to the /api/graphql interface are correctly treated as get read permissions by the RBAC interceptor, ensuring that users with read-only roles can read and access page content containing GraphQL data streams without problems.
Известные проблемы
- After deleting a model, the list page fails to reflect the deletion result immediately, and the deleted model still briefly exists in the list. Temporary solution, manually refresh the page.
- Modifying library_name in Gitlab by directly editing the readme file does not synchronize the model type change on the page.
Temporary solution: Use UI operation to modify the library_name to avoid direct operation in Gitlab.