• Русский
  • Примечания к выпуску

    AI 2.0.0

    Новые и оптимизированные функции

    Поддержка NPU

    С введением NPU Operator реализована поддержка управления аппаратным обеспечением NPU, что упрощает настройку использования NPU и повышает аппаратное ускорение.

    Очередь и контроль допуска

    С внедрением Alauda Build of Kueue реализовано управление очередями и контроль допуска, что оптимизирует планирование задач и распределение ресурсов.

    Реестр моделей

    Интеграция Kubeflow Model Registry улучшает управление моделями и контроль версий, упрощая процесс регистрации и хранения моделей.

    Распределённый вывод

    С добавлением llm-d теперь поддерживается распределённый вывод, что повышает производительность и эффективность использования ресурсов при масштабных задачах вывода.

    Поддержка Leader-Worker Set

    С введением Alauda Build of LeaderWorkerSet реализовано управление задачами распределённого обучения, упрощая распределение и координацию задач в модели Leader-Worker.

    AI Gateway

    Новый Alauda build of Envoy AI Gateway оптимизирует управление трафиком и безопасность, обеспечивая расширенные возможности проксирования AI-сервисов.

    Оркестрация Trainer

    Поддержка Kubeflow Trainer v2 улучшает планирование и управление задачами обучения моделей, обеспечивая более гибкие и эффективные рабочие процессы обучения.

    Оркестрация Pipelines

    Интеграция с Kubeflow Pipeline позволяет более эффективно организовывать оркестрацию пайплайнов и управление задачами, улучшая автоматизацию рабочих процессов.

    Векторное хранилище

    Введение Milvus обеспечивает эффективное решение для хранения векторов, поддерживая масштабируемое хранение векторных данных и быстрый поиск.

    NVIDIA DRA

    С внедрением NVIDIA DRA Driver for GPUs оптимизировано управление и планирование ресурсов GPU, что повышает их использование и производительность.

    Node Feature Discovery

    Alauda Build of Node Feature Discovery обеспечивает автоматическое обнаружение аппаратных особенностей и маркировку узлов, улучшая гибкость управления ресурсами узлов.

    Llama Stack Runtime

    Введение Llama Stack расширяет возможности AI-агентов, предоставляя эффективную среду выполнения для поддержки распределённых AI-задач.

    Generative AI

    С добавлением раздела Kserve's Generative AI расширена поддержка генеративного AI, оптимизируя развертывание моделей и вывод, особенно для приложений генеративного AI.

    Интеграция Low-Code Builder

    Обновление версии Dify и предоставление deployable Charts упрощают процесс создания приложений с низким кодом, дополнительно повышая эффективность разработки AI-приложений.

    Устаревшие функции

    Устаревание UI Fine-Tuning & Pretraining

    Из-за отсутствия широкой применимости, сложности горизонтального масштабирования и того, что данный метод не является основным в индустрии для обучения и дообучения моделей, эта функция устарела. Рекомендуется использовать дообучение и обучение моделей на основе ноутбуков.

    Устаревание Secret Manage

    Функция Secret Manage устарела из-за отсутствия актуальных сценариев использования, так как ручная интеграция с GitLab больше не требуется и не применяется.

    Исправленные ошибки

    • When updating the inference service resource yaml through the page, the volumeMount field is missing, which can cause the inference service to fail to start properly
    • In older versions, GraphQL queries (POST by default) were incorrectly intercepted by the gateway layer and checked for create permission. In the new version, requests sent to the /api/graphql interface are correctly treated as get read permissions by the RBAC interceptor, ensuring that users with read-only roles can read and access page content containing GraphQL data streams without problems.

    Известные проблемы

    • After deleting a model, the list page fails to reflect the deletion result immediately, and the deleted model still briefly exists in the list. Temporary solution, manually refresh the page.
    • Modifying library_name in Gitlab by directly editing the readme file does not synchronize the model type change on the page.
      Temporary solution: Use UI operation to modify the library_name to avoid direct operation in Gitlab.