logo
Alauda AI
English
Русский
English
Русский
logo
Alauda AI
Навигация

Обзор

Введение
Быстрый старт
Примечания к выпуску

Установка

Предварительная настройка
Установка Alauda AI Essentials
Установка Alauda AI

Обновление

Обновление с AI 1.3

Удаление

Удаление

Управление инфраструктурой

Управление устройствами

О Alauda Build of Hami
О плагине устройства NVIDIA GPU от Alauda Build

Мультиарендность

Руководства

Управление пространствами имён

Рабочее пространство

Обзор

Введение
Установка
Обновление

Как сделать

Создание WorkspaceKind
Создание Workbench

Развертывание модели и вывод

Обзор

Введение
Features

Сервис вывода

Введение

Руководства

Inference Service

Как сделать

Extend Inference Runtimes
Configure External Access for Inference Services
Configure Scaling for Inference Services

Устранение неполадок

Проблемы с таймаутами сервиса инференса при использовании MLServer Runtime
Служба инференса не переходит в состояние Running

Управление моделями

Введение

Руководства

Model Repository

Мониторинг и операции

Обзор

Введение
Features Overview

Ведение журналов и трассировка

Введение

Руководства

Логирование

Мониторинг ресурсов

Введение

Руководства

Мониторинг ресурсов

Справочник API

Введение

Kubernetes APIs

Inference Service APIs

ClusterServingRuntime [serving.kserve.io/v1alpha1]
InferenceService [serving.kserve.io/v1beta1]

Workbench APIs

Workspace Kind [kubeflow.org/v1beta1]
Workspace [kubeflow.org/v1beta1]

Manage APIs

AmlNamespace [manage.aml.dev/v1alpha1]

Operator APIs

AmlCluster [amlclusters.aml.dev/v1alpha1]
Глоссарий

Глоссарий#

Предыдущая страницаAmlCluster [amlclusters.aml.dev/v1alpha1]
nameDescription
Large Language ModelLLM (Large Language Model) — это модель ИИ, обученная на огромных объемах текстовых данных, способная понимать и генерировать естественный язык, с масштабом параметров, обычно варьирующимся от миллиардов до сотен миллиардов.
Inference ServiceInference Service — это сервис в области машинного обучения или глубокого обучения, предоставляющий высокопроизводительные, масштабируемые возможности предсказания или вывода для обученных моделей.
Inference RuntimesInference Runtime обеспечивает высокопроизводительную контейнерную среду для сервисов вывода на основе моделей, оптимизируя использование ресурсов, ускоряя процесс вывода и снижая задержки.
AI AgentAI Agent — это сущность ИИ, которая воспринимает окружающую среду, принимает решения и выполняет задачи автономно, обладая автономностью, адаптивностью и целеустремленностью.
Text GenerationText Generation — это процесс автоматической генерации связного и осмысленного текстового контента с использованием методов обработки естественного языка (NLP), основанный на заданных входных данных, таких как контекст, подсказки или правила.
Text ClassificationText Classification — это процесс присвоения текстовым данным заранее определённых категорий или меток, обычно достигаемый с помощью моделей машинного обучения или глубокого обучения, используемый в различных приложениях, таких как поиск информации, анализ тональности и обнаружение спама.
Text-to-ImageText-to-Image — это процесс автоматической генерации изображений на основе текстовых описаний с использованием технологий ИИ, которые объединяют NLP и компьютерное зрение для преобразования текста в визуальный контент.
Virtual GPUVirtual GPU (vGPU) — это технология, использующая виртуализацию для разделения и выделения физических ресурсов GPU нескольким виртуальным машинам, обеспечивая совместное и эффективное использование возможностей графической обработки.
Physical GPUPhysical GPU (pGPU) — это технология, которая напрямую подключает целую физическую видеокарту к виртуальной машине на хост-машине для эксклюзивного доступа к ресурсам GPU.