Введение

Сервис вывода является ключевой функцией платформы Alauda AI, предназначенной для эффективного развертывания моделей LLM в качестве онлайн-сервисов вывода, поддерживающим различные методы вызова, такие как HTTP API и gRPC. Через Сервис вывода пользователи могут быстро создавать приложения LLM и предоставлять стабильные, высокопроизводительные возможности LLM внешним пользователям.

WARNING

Запуск встроенного времени выполнения в контейнере требует привилегий суперпользователя. Пожалуйста, убедитесь, что он используется в надежной среде и следуйте вашим политикам безопасности.

Содержание

Основные преимущества

Быстрое развертывание модели:
- Поддерживает прямое развертывание сервисов вывода из Репозитория моделей, упрощая шаги развертывания.
- Поддержка пользовательских определенных образов docker для развертывания сложных сервисов вывода, определенных пользователем.
Поддержка многопрофильного времени выполнения:
- Интегрирует основные среды выполнения вывода, такие как Seldon MLServer и vLLM, поддерживает различные модели и удовлетворяет требованиям развертывания различных моделей.
Визуальная демонстрация вывода:
- Обеспечивает визуальные функции "демонстрации вывода" для общих типов задач, позволяя пользователям быстро проверять результаты вывода.
Гибкие методы вызова:
- Поддерживает различные методы вызова, такие как HTTP API и gRPC, позволяя пользователям делать запросы на возможности LLM в различных сценариях приложений.

Сценарии применения

Онлайн-приложения LLM:
- Развертывание моделей LLM в качестве онлайн-сервисов для предоставления возможностей LLM внешним пользователям.
Вывод в реальном времени:
- Поддерживает сценарии вывода в реальном времени, удовлетворяя потребности приложений с высокими требованиями к скорости отклика.
Пакетный вывод:
- Поддерживает пакетный вывод, выполняя расчеты вывода на больших наборах данных.
Интеграция приложений:
- Интеграция возможностей LLM в существующие приложения через API.

#Введение

#Содержание

#Основные преимущества

#Сценарии применения

Введение

Содержание

Основные преимущества

Сценарии применения