Использование Kubeflow Model Registry
Kubeflow Model Registry — это центральное хранилище для управления моделями машинного обучения, их версиями и связанной метаданной. Оно позволяет дата-сайентистам публиковать модели, отслеживать их происхождение и совместно работать над разработкой моделей.
Содержание
Доступ к Model RegistryРегистрация моделиВариант 1: Использование UIВариант 2: Использование Python клиентаРазвёртывание зарегистрированной моделиДоступ к Model Registry
- Откройте Dashboard: Войдите в центральную панель управления Kubeflow.
- Model Registry: Нажмите на Model Registry в боковой панели. Это откроет список зарегистрированных моделей в вашем namespace.
Примечание: Если вы не видите Model Registry, убедитесь, что экземпляр Model Registry был развернут в вашем namespace администратором платформы.
Регистрация модели
Вы можете зарегистрировать модели либо через пользовательский интерфейс, либо программно с помощью Python клиента.
Вариант 1: Использование UI
-
Создание зарегистрированной модели:
- Нажмите Register Model.
- Model Name: Введите уникальное имя (например,
fraud-detection). - Description: Добавьте описание.
- Version details: По желанию добавьте информацию о версии, теги и метаданные.
- Model Location: Укажите S3/URI к артефакту модели (например,
s3://my-bucket/models/fraud-detection/v1/). - Нажмите Create.
-
Создание версии:
- Нажмите на выпадающее меню рядом с Registered Model и выберите Register New Version.
- Введите имя версии, описание, метаданные и URI артефакта.
- Нажмите Register new version.
Вариант 2: Использование Python клиента
Вы можете регистрировать модели напрямую из Jupyter Notebook с помощью Python клиента model-registry.
Требования:
- Установите клиент:
python -m pip install model-registry=="0.3.5" kserve=="0.13" - Убедитесь, что у вас есть доступ к сервису Model Registry. Если вы работаете внутри Kubeflow Notebook, можно использовать внутренний DNS сервиса (например,
http://model-registry-service.<namespace>.svc:8080).
Пример кода:
Ниже приведён пример регистрации модели, хранящейся в S3.
Развёртывание зарегистрированной модели
После регистрации модели вы можете развернуть её как InferenceService с помощью KServe.
Для развёртывания обычно требуется URI артефакта модели. Его можно получить из UI Registry или через Python API:
После развёртывания контроллер KServe загрузит модель с указанного S3 URI и запустит сервер инференса.