При создании службы вывода пользователи теперь могут выбрать либо «Стандартный режим», либо «Расширенный режим», при этом «Стандартный режим» установлен по умолчанию.
Введена новая функция «Dashboards», позволяющая пользователям настраивать и добавлять графики на панели мониторинга в соответствии с их потребностями. Например, проекты, использующие GPU от производителей, отличных от NVIDIA, могут добавлять настраиваемые панели, предоставляемые этими производителями.
Доступен для установки новый плагин «Alauda AI Workbench», предоставляющий пользователям среды IDE, такие как Jupyter Notebook и VS Code.
Этот плагин заменяет «расширенные» возможности предыдущей версии и упрощает ненужные компоненты и некоторые функции, изначально присутствовавшие в Kubeflow.
Запущено нативное решение Kubeflow для удовлетворения потребностей клиентов проектов, привыкших использовать нативные возможности сообщества Kubeflow.
Введено решение с несколькими узлами и несколькими GPU для удовлетворения требований пользователей по развертыванию моделей с большим количеством параметров.
Запущены решения на основе ноутбуков для предварительного обучения и дообучения моделей, поддерживающие пользователей в оптимизации их моделей.
Введено решение аутентификации службы вывода на основе Enovy AI Gateway, поддерживающее создание API Keys для служб вывода с целью повышения возможностей контроля доступа.
Функциональность логгирования служб вывода была улучшена, включая такие возможности, как автоматическое обновление логов, приостановка обновлений и переключение контейнеров, что соответствует возможностям Alauda Container Platform.
Из-за ограниченного числа сценариев использования и влияния на пользовательский опыт служб вывода больших моделей, mlserver inference runtime был понижен до решения. Он больше не включается в продукт по умолчанию, но предоставляется как решение для поддержки специфических сценариев, таких как вывод малых языковых моделей.
Функция Apps и Dify позиционируются как возможности для разработки AI Agent, при этом Dify предлагает более простой подход к разработке благодаря low-code возможностям. В то время как чистая кастомизация и разработка с нуля через Apps менее удобны. Поэтому функция Apps была прекращена. Проекты, требующие чистой кастомной разработки AI Agent, могут быть реализованы через альтернативные решения.
Существует два способа загрузки моделей: через команду git push или через UI. Загрузка через командную строку обеспечивает лучшую производительность и более высокую скорость. Несмотря на удобство UI, при работе с большими файлами моделей, обычно размером в несколько сотен ГБ, интерфейс часто зависает. Поэтому функция загрузки моделей через UI была прекращена. Для удобства пользователей добавлена ссылка на документацию вместо оригинальной функции, позволяющая быстро перейти к руководству пользователя по командам для операций.
No issues in this release.