• Русский
  • Репозиторий моделей

    Основное назначение функции репозитория моделей — предоставить основанную на Git систему хранения с контролем версий для моделей машинного обучения, чтобы команды могли управлять файлами моделей, отслеживать версии и совместно работать в рамках разных tenant. Она использует Git LFS для хранения больших файлов и интегрируется с рабочими процессами MLOps, обеспечивая связь между разработкой и развертыванием моделей.

    Преимущества

    Контроль версий в стиле Git

    • Отслеживайте изменения моделей с помощью commits/branches/tags, обеспечивая воспроизводимость.

    Высокая скорость передачи

    • Загрузки через CLI/Notebook используют внутреннюю пропускную способность сети.

    Совместное использование между tenant

    • К общим моделям можно получать доступ из разных namespaces (например, public как marketplace моделей).

    Бесшовная интеграция

    • Развертывайте модели напрямую из репозитория в inference services.

    Основные возможности

    Создание и удаление репозитория моделей

    • Создавайте пустой репозиторий на базе Git с метаданными (name/description/visibility).
    • Удаляйте модели после проверки зависимостей (например, убедитесь, что нет активных inference services).

    Управление файлами

    1. CLI/Git LFS
      • Используйте git lfs track для больших файлов (например, *.bin, *.h5).
      • Пример:
        git clone <model_repo_url>
        git lfs install
        cp ~/local_model/* . && git add . && git commit -m "v1.0" && git push

    Контроль версий

    1. Ветвление
      • Поддерживайте параллельные версии (например, ветви experimental и main).
    2. Тегирование
      • Помечайте релизы через UI/CLI (например, git tag -a v2.0 -m "Stable release").
    3. Синхронизация метаданных
      • Автоматически считывайте README.md из ветви по умолчанию для описаний моделей.

    Совместное использование между tenant

    1. Общие модели
      • Установите значение visibility в "Shared" при создании для доступа между tenant.
    2. Публичный marketplace
      • Используйте namespace public для публикации open-source моделей (например, конверсий HuggingFace).

    Интеграция с MLOps

    1. Готовность к развертыванию
      • Запуск inference service в один клик из версий модели, помеченных тегами.
    2. Интеграция с Notebook
      • Загружайте модели напрямую в AML Notebooks для тестирования:
        !git clone https://aml-public/resnet50.git

    Технические примечания

    1. Требование к Git LFS
      • Необходимо включить .gitattributes, чтобы указать файлы, отслеживаемые через LFS (например, *.zip filter=lfs diff=lfs merge=lfs).
    2. Правила для ветви по умолчанию
      • Неправильно настроенные метаданные README.md могут заблокировать развертывание inference.

    Создание модели и загрузка файлов модели

    Подробные шаги по загрузке файлов модели в репозиторий моделей см. в разделе Upload Models Using Notebook.