Model Repository — это версионированное хранилище и центр управления, разработанный специально для моделей LLM на платформе Alauda AI. Основанный на технологии Git LFS, он обеспечивает эффективное и надежное хранение моделей, охватывая ключевые этапы, такие как развертывание сервиса вывода, дообучение моделей и их оценка. С помощью Model Repository пользователи могут легко управлять версиями моделей, обмениваться модельными ресурсами и осуществлять полное управление жизненным циклом моделей.
Inference Service — это ключевая функция платформы Alauda AI, предназначенная для эффективного развертывания моделей LLM в виде онлайн-сервисов вывода, поддерживающих различные методы вызова, такие как HTTP API и gRPC. С помощью Inference Service пользователи могут быстро создавать приложения на базе LLM и предоставлять внешние стабильные и высокопроизводительные возможности LLM.