Использование томов Kubeflow

Тома в Kubeflow управляются как Kubernetes Persistent Volume Claims (PVC). Они обеспечивают постоянное хранилище для ваших данных, рабочих пространств и моделей независимо от жизненного цикла ваших Notebook servers или других рабочих нагрузок.

Содержание

Создание тома Управление томами Использование тома в Notebooks Использование конечных точек Kubeflow KServe Доступ к интерфейсу Endpoints Развертывание новой модели Мониторинг и тестирование

Создание тома

Доступ к Dashboard: Нажмите Volumes на боковой панели центрального Dashboard Kubeflow.
Новый том: Нажмите New Volume.
Настройка:
- Name: Введите уникальное имя тома.
- Storage Class: Выберите Storage Class (например, topolvm, nfs), если доступно несколько вариантов.
- Size: Укажите размер тома в Gi (например, 10).
- Access Mode:
  - ReadWriteOnce (RWO): Монтируется одним узлом (обычно используется для блочного хранилища).
  - ReadWriteMany (RWX): Монтируется несколькими узлами (обычно используется для NFS/File storage).
Создать: Нажмите Create. После подготовки статус тома изменится на Bound.

Управление томами

Открыть PVC Viewer: Нажмите на значок "Folder" рядом с томом, чтобы создать временный Pod, который смонтирует том и откроет файловый браузер. Это позволяет просматривать, загружать и скачивать файлы напрямую в том. Нажмите "Close", чтобы удалить временный Pod после завершения.
Удалить: Нажмите на значок удаления (корзина) рядом с томом, чтобы удалить его. Примечание: Это навсегда удалит данные.
Фильтр: Фильтруйте тома по имени, статусу или Storage Class с помощью строки поиска.

Использование тома в Notebooks

Чтобы использовать том в Notebook Server:

При создании New Notebook создайте стандартный Workspace Volume (монтируется в /home/jovyan) или...
Прокрутите до Data Volumes, чтобы подключить дополнительные существующие тома.
Нажмите Attach Existing Volume и выберите нужный том.
Укажите Mount Path (например, /home/jovyan/data).

Использование конечных точек Kubeflow KServe

Интерфейс KServe Endpoints позволяет напрямую из Dashboard Kubeflow разворачивать, управлять и отслеживать inference services для ваших моделей машинного обучения.

Доступ к интерфейсу Endpoints

Нажмите KServe Endpoints в боковой панели центрального Dashboard.
Выберите свой namespace в верхней части страницы.
Вы увидите список развернутых InferenceServices с их статусом и URL.

Развертывание новой модели

New Endpoint: Нажмите New Endpoint.
InferenceService YAML:
- Предоставьте YAML-описание для вашего InferenceService. В качестве шаблона можно использовать приведенный ниже пример YAML.

Deploy: Нажмите Create.

apiVersion: serving.kserve.io/v1beta1
kind: InferenceService
metadata:
  name: my-model
  namespace: my-namespace
spec:
  predictor:
    model:
      modelFormat:
        name: "transformers"
      runtime: aml-vllm-0.9.2-cuda-12.6
      storageUri: "hf://model-repo/model-name"

Мониторинг и тестирование

После развертывания дождитесь, пока статус не станет Ready.

Inspect: Нажмите на имя модели, чтобы увидеть подробности YAML и логи.
Get URL: Скопируйте предоставленный URL конечной точки (например, http://model-name.namespace.svc.cluster.local/v1/models/model-name:predict или внешний URL).
Test: Используйте curl или Python client, чтобы отправить запрос на prediction.

#Использование томов Kubeflow

#Содержание

#Создание тома

#Управление томами

#Использование тома в Notebooks

#Использование конечных точек Kubeflow KServe

#Доступ к интерфейсу Endpoints

#Развертывание новой модели

#Мониторинг и тестирование