Репозиторий моделей
Основное определение функции репозитория моделей — предоставить систему хранения моделей машинного обучения с управлением версиями на базе Git, позволяющую командам управлять файлами моделей, отслеживать версии и сотрудничать между тенантами. Используется Git LFS для хранения больших файлов и интеграция с MLOps-воркфлоу для объединения разработки и развертывания моделей.
Преимущества
Версионный контроль на базе Git
- Отслеживание изменений моделей через коммиты/ветки/теги, обеспечивая воспроизводимость.
Высокоскоростные передачи
- Загрузки через CLI/Notebook используют пропускную способность внутренней сети.
Совместное использование между тенантами
- Общие модели доступны в разных пространствах имён (например,
publicкак маркетплейс моделей).
Бесшовная интеграция
- Прямое развертывание моделей из репозитория в сервисы инференса.
Основные функции
Создание и удаление репозитория моделей
- Создание пустого репозитория на базе Git с метаданными (название/описание/видимость).
- Удаление моделей после проверки зависимостей (например, отсутствие активных сервисов инференса).
Управление файлами
- CLI/Git LFS
- Используйте
git lfs trackдля больших файлов (например,*.bin,*.h5). - Пример:
- Используйте
Управление версиями
- Ветвление
- Поддержка параллельных версий (например, ветки
experimentalиmain).
- Поддержка параллельных версий (например, ветки
- Тегирование
- Пометка релизов через UI/CLI (например,
git tag -a v2.0 -m "Stable release").
- Пометка релизов через UI/CLI (например,
- Синхронизация метаданных
- Автоматическое чтение
README.mdиз ветки по умолчанию для описания модели.
- Автоматическое чтение
Совместное использование между тенантами
- Общие модели
- Установка видимости "Shared" при создании для доступа между тенантами.
- Публичный маркетплейс
- Использование пространства имён
publicдля публикации open-source моделей (например, конверсии HuggingFace).
- Использование пространства имён
Интеграция с MLOps
- Готовность к развертыванию
- Запуск сервиса инференса в один клик из тегированных версий модели.
- Интеграция с Notebook
- Прямое получение моделей в AML Notebooks для тестирования:
Технические заметки
- Требование Git LFS
- Необходимо включать
.gitattributesдля указания файлов, отслеживаемых LFS (например,*.zip filter=lfs diff=lfs merge=lfs).
- Необходимо включать
- Правила ветки по умолчанию
- Некорректные метаданные в
README.mdмогут блокировать развертывание инференса.
- Некорректные метаданные в
Создание модели и загрузка файлов модели
Подробные шаги по загрузке файлов модели в репозиторий моделей смотрите в разделе Upload Models Using Notebook.