Model Repository
Основное определение функции model repository — предоставить систему хранения моделей машинного обучения с управлением версиями на базе Git, позволяющую командам управлять файлами моделей, отслеживать версии и сотрудничать между тенантами. Используется Git LFS для хранения больших файлов и интеграция с MLOps workflow для объединения разработки и развертывания моделей.
Преимущества
Версионный контроль на базе Git
- Отслеживание изменений моделей через коммиты/ветки/теги, обеспечивая воспроизводимость.
Высокоскоростная передача
- Загрузка через CLI/Notebook использует пропускную способность внутренней сети.
Совместное использование между тенантами
- Общие модели доступны в разных пространствах имён (например,
publicкак маркетплейс моделей).
Бесшовная интеграция
- Прямое развертывание моделей из репозитория в inference-сервисы.
Основные функции
Создание и удаление Model Repository
- Создание пустого репозитория на базе Git с метаданными (имя/описание/видимость).
- Удаление моделей после проверки зависимостей (например, отсутствие активных inference-сервисов).
Управление файлами
- CLI/Git LFS
- Используйте
git lfs trackдля больших файлов (например,*.bin,*.h5). - Пример:
- Используйте
Управление версиями
- Ветвление
- Поддержка параллельных версий (например, ветки
experimentalиmain).
- Поддержка параллельных версий (например, ветки
- Тегирование
- Пометка релизов через UI/CLI (например,
git tag -a v2.0 -m "Stable release").
- Пометка релизов через UI/CLI (например,
- Синхронизация метаданных
- Автоматическое чтение
README.mdиз ветки по умолчанию для описания модели.
- Автоматическое чтение
Совместное использование между тенантами
- Общие модели
- Установка видимости "Shared" при создании для доступа между тенантами.
- Публичный маркетплейс
- Использование пространства имён
publicдля публикации open-source моделей (например, конверсии HuggingFace).
- Использование пространства имён
Интеграция с MLOps
- Готовность к развертыванию
- Запуск inference-сервиса одним кликом из тегированных версий модели.
- Интеграция с Notebook
- Прямое подтягивание моделей в AML Notebooks для тестирования:
Технические заметки
- Требование Git LFS
- Необходимо включать
.gitattributesдля указания файлов, отслеживаемых LFS (например,*.zip filter=lfs diff=lfs merge=lfs).
- Необходимо включать
- Правила ветки по умолчанию
- Некорректные метаданные в
README.mdмогут блокировать развертывание inference.
- Некорректные метаданные в
Создание модели и загрузка файлов модели
Подробные шаги по загрузке файлов модели в model repository смотрите в разделе Upload Models Using Notebook.