logo
Alauda Container Platform
English
Русский
English
Русский
logo
Alauda Container Platform
Навигация

Обзор

Архитектура
Примечания к выпуску

Установка

Обзор

Подготовка к установке

Предварительные требования
Загрузка
Предварительная обработка узлов
Установка
Восстановление после катастрофы для глобального кластера

Обновление

Обзор
Подготовка к обновлению
Обновление глобального кластера
Обновление рабочих кластеров

Пользовательский интерфейс

Веб-консоль

Обзор
Доступ к веб-консоли
Настройка веб-консоли
Настройка левой навигации

CLI Инструменты

ACP CLI (ac)

Начало работы с ACP CLI
Настройка ACP CLI
Использование команд ac и kubectl
Управление профилями CLI
Расширение ACP CLI с помощью плагинов
AC CLI Developer Command Reference
AC CLI Справочник команд администратора
violet CLI

Настройка

Конфигурация Feature Gate

Кластеры

Обзор
Неизменяемая инфраструктура

Управление узлами

Обзор
Добавление узлов в локальные кластеры
Управление узлами
Мониторинг узлов

Управляемые кластеры

обзор

Импорт кластеров

Обзор
Импорт стандартного кластера Kubernetes
Импорт кластера OpenShift
Импорт кластера Amazon EKS
Импорт кластера GKE
Импорт кластера Huawei Cloud CCE (публичное облако)
Импорт кластера Azure AKS
Импорт кластера Alibaba Cloud ACK
Импорт кластера Tencent Cloud TKE
Регистрация кластера

Инициализация кластера в публичном облаке

Инициализация сети

Конфигурация инициализации сети кластера AWS EKS
Дополнительная информация по AWS EKS
Инициализация конфигурации сети кластера Huawei Cloud CCE
Конфигурация инициализации сети кластера Azure AKS
Конфигурация инициализации сети кластера Google GKE

Инициализация хранилища

Обзор
Конфигурация инициализации хранилища кластера AWS EKS
Инициализация конфигурации хранилища кластера Huawei Cloud CCE
Конфигурация инициализации хранилища кластера Azure AKS
Конфигурация инициализации хранилища кластера Google GKE

Как сделать

Настройка сети для импортируемых кластеров
Получение информации о импортируемом кластере
Доверие небезопасному реестру образов
Сбор сетевых данных с сетевых карт с пользовательскими именами
Создание локального кластера
Хостинг контрольной плоскости
Планирование узлов кластера
Шифрование etcd

Как сделать

Добавление внешнего адреса для встроенного реестра
Выбор контейнерного рантайма
Обновление учетных данных публичного репозитория

Резервное копирование и восстановление

Обзор
Установка
Репозиторий резервного копирования

Управление резервным копированием

Резервное копирование ETCD
Создание расписания резервного копирования приложения
Хуки

Управление восстановлением

Выполнение задачи восстановления приложения
Замена реестра образов

Сетевые взаимодействия

Введение

Архитектура

Понимание Kube-OVN
Понимание ALB
Понимание MetalLB

Основные понятия

Совместимость ALB с аннотациями Ingress-NGINX
Сравнение Service, Ingress, Gateway API и ALB Rule
GatewayAPI

Руководства

Создание сервисов
Создание Ingress
Создание доменного имени
Создание сертификатов
Создание пула внешних IP-адресов
Создание BGP-пиров
Настройка подсетей
Настройка сетевых политик
Создание Admin Network Policies
Настройка сети Kube-OVN для поддержки нескольких сетевых интерфейсов Pod (Alpha)
Настройка сетевых политик кластера
Настройка Egress Gateway
Наблюдаемость сети
Настройка правил ALB
Межкластерное соединение (Alpha)
Endpoint Health Checker
NodeLocal DNSCache

Как сделать

Подготовка физической сети Kube-OVN Underlay
Soft Data Center LB Solution (Alpha)
Автоматическое взаимное подключение подсетей Underlay и Overlay
Установка Ingress-Nginx через Cluster Plugin
Установка Ingress-Nginx через Ingress Nginx Operator
Задачи для Ingress-Nginx

ALB

Auth
Развертывание высокодоступного VIP для ALB
Модификация заголовков
HTTP Redirect
L4/L7 Таймаут
ModSecurity
TCP/HTTP Keepalive
Использование OAuth Proxy с ALB
Настройка GatewayApi Gateway через ALB
Привязка NIC в ALB
Принятие решений по выбору производительности ALB
Развертывание ALB
Проброс IPv6-трафика на IPv4-адреса внутри кластера через ALB
OTel
ALB Monitoring
CORS
Политика сессионной аффинности балансировки нагрузки в ALB
Перезапись URL
Calico Network поддерживает шифрование WireGuard
Kube-OVN Overlay Network поддерживает шифрование IPsec
Руководство пользователя DeepFlow

Устранение неполадок

Как решить проблемы межузловой коммуникации в ARM-средах?
Определение причины ошибки

Хранение

Введение

Основные понятия

Основные понятия
Persistent Volume
Режимы доступа и режимы томов

Руководства

Создание Storage Class типа CephFS File Storage
Создание класса блочного хранилища CephRBD
Создание локального Storage Class TopoLVM
Создание общего класса хранения NFS
Развертывание компонента Volume Snapshot
Создание PV
Создание PVC
Использование снимков томов

Как сделать

Generic ephemeral volumes
Использование emptyDir
Настройка постоянного хранилища с использованием NFS
Руководство по аннотированию возможностей стороннего хранилища

Устранение неполадок

Восстановление после ошибки расширения PVC
Конфигурация машины

Масштабируемость и производительность

Оценка ресурсов для глобального кластера
Оценка ресурсов для рабочей нагрузки кластера
Повышение стабильности Kubernetes для крупных кластеров
Конфигурация диска

Хранение

Распределённое хранилище Ceph

Введение

Установка

Создание кластера стандартного типа
Создание Stretch Type кластера
Архитектура

Основные понятия

Основные концепции

Руководства

Доступ к сервисам хранения
Управление Storage Pools
Развертывание компонентов на конкретных узлах
Добавление устройств/классов устройств
Мониторинг и оповещения

Как сделать

Настройка выделенного кластера для распределённого хранилища
Очистка распределённого хранилища

Восстановление после сбоев

Восстановление после сбоев файлового хранилища
Восстановление после сбоев блочного хранилища
Восстановление после сбоев в объектном хранилище
Обновление параметров оптимизации
Создание пользователя ceph object store

MinIO Object Storage

Введение
Установка
Архитектура

Основные понятия

Основные концепции

Руководства

Добавление пула хранения
Мониторинг и оповещения

Как сделать

Восстановление данных после аварий

Локальное хранилище TopoLVM

Введение
Установка

Руководства

Управление устройствами
Мониторинг и оповещения

Как сделать

Резервное копирование и восстановление PVC файловой системы TopoLVM с помощью Velero

Безопасность

Alauda Container Security

Безопасность и соответствие

Соответствие требованиям

Введение
Установка Alauda Container Platform Compliance с Kyverno

Как сделать

Конфигурация доступа к приватному реестру
Политика проверки подписи образов
Политика проверки подписей образов с использованием Secrets
Политика проверки реестра образов
Политика предотвращения выхода из контейнера
Политика Принудительного Применения Security Context
Политика сетевой безопасности
Политика безопасности томов

API Refiner

Введение
Установка Alauda Container Platform API Refiner
О сервисе соответствия Alauda Container Platform

Пользователи и роли

Пользователь

Введение

Руководства

Управление ролями пользователей
Создание пользователя
Управление пользователями

Группа

Введение

Руководства

Управление ролями групп пользователей
Создание локальной группы пользователей
Управление членством в локальной группе пользователей

Роль

Введение

Руководства

Создание роли
Управление пользовательскими ролями

IDP

Введение

Руководства

Управление LDAP
Управление OIDC

Устранение неполадок

Удаление пользователя

Политика пользователя

Введение

Мультиарендность (Project)

Введение

Руководства

Создание проекта
Управление квотами проекта
Управление проектом
Управление кластером проекта
Управление участниками проекта

Аудит

Введение

Телеметрия

Установка

Сертификаты

Автоматическая ротация сертификатов Kubernetes
cert-manager
Сертификаты OLM
Мониторинг сертификатов

Виртуализация

Виртуализация

Обзор

Введение
Установка

Образы

Введение

Руководства

Добавление образов виртуальных машин
Обновление/Удаление образов виртуальных машин
Обновление/удаление учетных данных образа

Как сделать

Создание образов Windows на основе ISO с использованием KubeVirt
Создание образов Linux на основе ISO с использованием KubeVirt
Экспорт образов виртуальных машин
Разрешения

Виртуальная машина

Введение

Руководства

Создание виртуальных машин/групп виртуальных машин
Пакетные операции с виртуальными машинами
Вход в виртуальную машину с использованием VNC
Управление ключевыми парами
Управление виртуальными машинами
Мониторинг и оповещения
Быстрый поиск виртуальных машин

Как сделать

Настройка проброса USB-хоста
Горячая миграция виртуальной машины
Восстановление виртуальной машины
Клонирование виртуальных машин в KubeVirt
Подготовка среды для физического GPU Passthrough
Настройка высокой доступности для виртуальных машин
Создание шаблона ВМ на основе существующей виртуальной машины

Устранение неполадок

Миграция Pod виртуальных машин и восстановление после аварийного завершения работы узлов виртуальных машин
Сообщения об ошибках горячей миграции и решения

Сеть

Введение

Руководства

Настройка сети

Как сделать

Контроль сетевых запросов виртуальной машины через Network Policy
Настройка SR-IOV
Настройка виртуальных машин для использования режима сетевого биндинга с поддержкой IPv6

Хранение данных

Введение

Руководства

Управление виртуальными дисками

Резервное копирование и восстановление

Введение

Руководства

Использование снимков

Разработчик

Обзор

Быстрый старт

Creating a simple application via image

Создание приложений

Построение архитектуры приложения

Основные понятия

Типы приложений
Custom Applications
Типы рабочих нагрузок
Понимание параметров
Понимание переменных окружения
Понимание команд запуска
Описание единиц ресурсов

Пространства имён

Создание пространств имён
Импорт пространств имён
Resource Quota
Limit Range
Pod Security Admission
Назначение UID/GID
Коэффициент Overcommit
Управление участниками пространства имён
Обновление Namespaces
Удаление/Исключение Namespaces

Создание приложений

Создание приложений из образа
Создание приложений из Chart
Создание приложений из YAML
Создание приложений из кода
Creating applications from Operator Backed
Создание приложений с использованием CLI

Эксплуатация и сопровождение приложений

Развертывание приложений

Установка Alauda Container Platform Argo Rollouts
Application Blue Green Deployment
Application Canary Deployment
Описание статуса

KEDA (Kubernetes Event-driven Autoscaling)

KEDA Overview
Установка KEDA

Как сделать

Интеграция ACP Monitoring с плагином Prometheus
Приостановка автоскейлинга в KEDA
Настройка HPA
Запуск и остановка приложений
Настройка VerticalPodAutoscaler (VPA)
Настройка CronHPA
Обновление приложений
Экспорт приложений
Обновление и удаление Chart-приложений
Управление версиями приложений
Удаление приложений
Обработка ошибок нехватки ресурсов
Проверки состояния

Рабочие нагрузки

Deployments
DaemonSets
StatefulSets
CronJobs
Jobs
Pods
Контейнеры
Работа с Helm charts

Конфигурации

Настройка ConfigMap
Настройка Secrets

Наблюдаемость приложения

Мониторинговые панели
Логи
События

Как сделать

Настройка правил срабатывания планировщика задач

Образы

Обзор образов

Как сделать

Создание образов
Управление образами

Реестр

Введение

Установка

Установка через YAML
Установка через Web UI

Руководство пользователя

Распространённые операции с командами CLI
Using Alauda Container Platform Registry in Kubernetes Clusters

Source to Image

Обзор

Введение
Архитектура
Примечания к выпуску
Политика жизненного цикла

Установка

Installing Alauda Container Platform Builds

Обновление

Обновление сборок Alauda Container Platform

Руководства

Управление приложениями, созданными из кода

Как сделать

Создание приложения из кода

Стратегия изоляции узлов

Введение
Архитектура

Основные понятия

Основные понятия

Руководства

Создание стратегии изоляции узлов
Разрешения
Часто задаваемые вопросы

GitOps

Введение

Установка

Установка Alauda Build of Argo CD
Установка Alauda Container Platform GitOps

Обновление

Обновление Alauda Container Platform GitOps
Архитектура

Основные понятия

GitOps

Концепция Argo CD

Введение
Application
ApplicationSet
Tool
Helm
Kustomize
Directory
Sync
Health

Концепции GitOps в Alauda Container Platform

Введение
Alauda Container Platform GitOps Sync and Health Status

Руководства

Создание GitOps приложения

Creating GitOps Application
Creating GitOps ApplicationSet

Наблюдаемость GitOps

Argo CD Component Monitoring
GitOps Applications Ops

Как сделать

Интеграция репозиториев кода через панель управления Argo CD
Создание приложения Argo CD через панель управления Argo CD
Создание Argo CD Application через веб-консоль
Как получить информацию для доступа к Argo CD
Устранение неполадок

Расширение

Обзор
Оператор
Плагин кластера
Загрузка пакетов

Наблюдаемость

Обзор

Мониторинг

Введение
Установка

Архитектура

Архитектура модуля мониторинга
Руководство по выбору компонента мониторинга
Планирование ёмкости компонента мониторинга
Основные понятия

Руководства

Управление метриками
Управление оповещениями
Управление уведомлениями
Управление мониторинговыми панелями
Управление Probe

Как сделать

Резервное копирование и восстановление данных мониторинга Prometheus
Резервное копирование и восстановление данных мониторинга VictoriaMetrics
Сбор сетевых данных с сетевых интерфейсов с пользовательскими именами

Распределённое трассирование

Введение
Установка
Архитектура
Основные понятия

Руководства

Query Tracing
Query Trace Logs

Как сделать

Безвредная интеграция трассировки в Java-приложения
Бизнес-логи, связанные с TraceID

Устранение неполадок

Невозможно выполнить запрос требуемого трассирования
Неполные данные трассировки

Логи

Введение
Установка

Архитектура

Архитектура модуля логирования
Руководство по выбору компонента логирования
Планирование ёмкости компонента логирования
Основные понятия

Руководства

Логи

Как сделать

Как архивировать логи в стороннее хранилище
Как взаимодействовать с внешними кластерами ES Storage

События

Введение
События

Инспекция

Введение
Архитектура

Руководства

Inspection
Component Health Status

Аппаратные ускорители

О Alauda Build of Hami
О плагине устройства NVIDIA GPU от Alauda Build

Alauda Service Mesh

Service Mesh 1.x
Service Mesh 2.x

Alauda AI

О Alauda AI

Alauda DevOps

О платформе Alauda DevOps

Управление затратами Alauda

О системе управления затратами Alauda

Alauda Application Services

Обзор

Введение
Архитектура
Установка
Обновление

Alauda Database Service для MySQL

О сервисе Alauda Database Service для MySQL-MGR
О сервисе Alauda Database Service для MySQL-PXC

Сервис кэширования Alauda для Redis OSS

О сервисе Alauda Cache Service for Redis OSS

Alauda Streaming Service for Kafka

О сервисе Alauda Streaming Service for Kafka

Сервис потоковой передачи Alauda для RabbitMQ

О сервисе Alauda Streaming Service for RabbitMQ

Поддержка PostgreSQL в Alauda

О поддержке PostgreSQL в Alauda

Управление операциями

Введение

Управление шаблонами параметров

Введение

Руководства

Управление шаблонами параметров

Управление резервным копированием

Введение

Руководства

Внешнее хранилище S3
Управление резервным копированием

Управление инспекциями

Введение

Руководства

Создание задачи инспекции
Задача Exec Inspection
Обновление и удаление задач инспекции

Как сделать

Как настроить расписание инспекций?

Рекомендации по оптимизации инспекций

MySQL

Оптимизация IO нагрузки MySQL
Оптимизация использования памяти MySQL
Оптимизация использования дискового пространства MySQL
Оптимизация количества активных потоков MySQL
Оптимизация блокировок строк MySQL

Redis

Redis BigKey
Высокая загрузка CPU в Redis
Высокое использование памяти в Redis

Kafka

Высокая загрузка CPU в Kafka
Оптимизация Rebalance в Kafka
Оптимизация использования памяти Kafka
Оптимизация пространства хранения Kafka

RabbitMQ

Обработка исключений базы данных RabbitMQ Mnesia

Управление оповещениями

Введение

Руководства

Взаимосвязь с возможностями платформы

Управление обновлениями

Введение

Руководства

Обновление экземпляра

Справочник API

Обзор

Введение
Руководство по использованию Kubernetes API

Advanced APIs

Alert APIs

AlertHistories [v1]
AlertHistoryMessages [v1]
AlertStatus [v2]
SilenceStatus [v2]

Event APIs

Search

Log APIs

Aggregation
Archive
Context
Search

Monitoring APIs

Indicators [monitoring.alauda.io/v1beta1]
Metrics [monitoring.alauda.io/v1beta1]
Variables [monitoring.alauda.io/v1beta1]

Kubernetes APIs

Alert APIs

AlertTemplate [alerttemplates.aiops.alauda.io/v1beta1]
PrometheusRule [prometheusrules.monitoring.coreos.com/v1]

Inspection APIs

Inspection [inspections.ait.alauda.io/v1alpha1]

Notification APIs

Notification [notifications.ait.alauda.io/v1beta1]
NotificationGroup [notificationgroups.ait.alauda.io/v1beta1]
NotificationTemplate [notificationtemplates.ait.alauda.io/v1beta1]
Предыдущая страницаKube-OVN Overlay Network поддерживает шифрование IPsec
Следующая страницаУстранение неполадок

Просмотреть полную документацию в формате PDF

#Руководство пользователя DeepFlow

DeepFlow предоставляет панели Grafana для визуализации метрик производительности сети и приложений, а также возможности автоматического трассирования приложений с использованием технологии eBPF.
Для доступа к панелям Grafana DeepFlow необходимо установить плагин DeepFlow из Marketplace.
После установки вы можете получить доступ к веб-интерфейсу Grafana через Ingress, настроенный во время установки. Для входа в веб-интерфейс Grafana требуются учетные данные.

Для получения дополнительной информации о работе с панелями Grafana обратитесь к документации Grafana.

#Содержание

#Вход в систему

Для входа в веб-интерфейс Grafana вам потребуется следующая информация, которая настраивается во время установки плагина DeepFlow:

  • Имя пользователя: имя пользователя для веб-консоли Grafana.
  • Пароль: пароль для веб-консоли Grafana.

После первого входа настоятельно рекомендуется изменить пароль по соображениям безопасности.

#Использование панелей

Перейдите в раздел Dashboards в веб-интерфейсе Grafana, чтобы получить доступ к различным преднастроенным панелям, предоставляемым DeepFlow.
Панели расположены в двух папках: DeepFlow System и DeepFlow Template.

  • DeepFlow System: содержит системные панели, предоставляющие информацию о состоянии и производительности системы DeepFlow в целом.
  • DeepFlow Templates: содержит панели на уровне приложений, которые можно настраивать в соответствии с конкретными требованиями приложений.

#DeepFlow System

В этой папке находится панель с именем DeepFlow Agent, которая предоставляет информацию о состоянии и производительности узлов, на которых развернуты агенты DeepFlow.

Что касается наблюдаемости сети, она включает метрики, такие как:

МетрикаПанели
Статистика пропускной способности всех выбранных агентовПропускная способность
Топ <agent, signal> по средней пропускной способности
Топ агентов по общей пропускной способности
Счетчики ядра NIC (только для информации)Потери пакетов на интерфейсах
bps на интерфейсах
pps на интерфейсах
[dispatcher] AF_PACKET/cBPF CollectorПакетов в секунду
🔥[ВНИМАНИЕ] Потери пакетов в ядре (агент не может обработать)
Обратный таймстамп ядра > 1 мс (только для информации)
Квантификация производительности TCPИгнорируемые TCP-пакеты с аномальными TCP-флагами
TCP-пакеты, не подлежащие повторной передаче
Нераспознанные пакеты протокола L7
ПРИМЕЧАНИЕ

ВНИМАНИЕ: панели, отмеченные 🔥, указывают на потенциальные проблемы, требующие внимания.

#DeepFlow Templates

В этой папке содержатся различные панели, включая метрики сети/L4, метрики приложений/L7 и панели автоматического трассирования.

Ниже приведены панели, связанные с наблюдаемостью сети:

КаталогПанелиОписаниеМетрики/Панели
Сеть/L4Сеть - Cloud HostПредоставляет метрики сети/L4 для хостов кластера, включая пропускную способность, пакеты, потоки и производительность TCP.Пропускная способность (bps)
Коэффициент повторных передач
Коэффициент отказа установления TCP-соединения
Задержка установления TCP-соединения
Сеть - Cloud Host MapВизуализирует топологию сети хостов кластера, показывая соединения и потоки трафика между ними.Карта хоста облака
Пропускная способность (bps)
Коэффициент повторных передач TCP (%)
Коэффициент отказа установления TCP-соединения (%)
Задержка установления TCP-соединения (мс)
Сеть - K8s PodПредоставляет метрики сети/L4 для Kubernetes Pod, включая пропускную способность, пакеты, потоки и производительность TCP.Пропускная способность (bps)
Коэффициент повторных передач
Коэффициент отказа установления TCP-соединения
Задержка установления TCP-соединения
Сеть - K8s Pod MapВизуализирует топологию сети Kubernetes Pod, показывая соединения и потоки трафика между ними.Карта Pod
Пропускная способность (bps)
Коэффициент повторных передач TCP (%)
Коэффициент отказа установления TCP-соединения (%)
Задержка установления TCP-соединения (мс)
Сеть - Flow LogОтображает подробные логи потоков сетевого трафика в Kubernetes Pod, включая IP-адреса источника и назначения, порты, протоколы и другое.Общее количество
Количество ошибок
Распределение задержек установления TCP-соединения
Распределение задержек передачи данных TCP
Лог потоков
Сеть - Flow Log - CloudОтображает подробные логи потоков сетевого трафика на хостах кластера, включая IP-адреса источника и назначения, порты, протоколы и другое.Общее количество
Количество ошибок
Распределение задержек установления TCP-соединения
Распределение задержек передачи данных TCP
Лог потоков
Приложение/L7Приложение - Cloud HostПредоставляет метрики приложений/L7 для хостов кластера, включая скорость запросов, количество ошибок и задержки для различных протоколов, таких как HTTP, DNS, MySQL, Redis и MongoDB.Запросы
Ошибки сервера
Задержка
Приложение - Cloud Host MapВизуализирует топологию приложений хостов кластера, показывая соединения и потоки трафика между различными приложениями.Карта хоста облака
Запросы
Ошибки сервера
Задержка
Приложение - K8s PodПредоставляет метрики приложений/L7 для Kubernetes Pod, включая скорость запросов, количество ошибок и задержки для различных протоколов, таких как HTTP, DNS, MySQL, Redis и MongoDB.Запросы
Ошибки сервера
Задержка
Приложение - K8s Pod MapВизуализирует топологию приложений Kubernetes Pod, показывая соединения и потоки трафика между различными приложениями.Карта Pod
Запросы
Ошибки сервера
Задержка
Приложение - Request LogОтображает подробные логи запросов для приложений, работающих в Kubernetes Pod, включая IP-адреса источника и назначения, URL, коды ответов и другое.Общее количество
Количество ошибок
Гистограмма задержек
Лог запросов
Приложение - Request Log - CloudОтображает подробные логи запросов для приложений, работающих в сетях хостов, включая IP-адреса источника и назначения, URL, коды ответов и другое.Общее количество
Количество ошибок
Гистограмма задержек
Лог запросов
Приложение - K8s IngressПредоставляет метрики приложений/L7 для ресурсов Kubernetes Ingress, включая скорость запросов, количество ошибок и задержки для HTTP-трафика.Карта запросов Upstream
Запросы
Задержка
Ошибки
Пропускная способность
Приложение - DNS MonitoringМониторинг DNS-запросов и ответов, предоставляющий информацию о производительности DNS и возможных проблемах.Топология DNS
Задержка
Доля ошибок
Запросы
Анализ логов
Приложение - SQL Monitoring - K8SМониторинг SQL-запросов и производительности баз данных, работающих в Kubernetes Pod, например MySQL, PostgreSQL и MongoDB.Топология SQL
Подключения
Задержка
Ошибки
Пропускная способность
Анализ SQL
Приложение - SQL Monitoring - CloudМониторинг SQL-запросов и производительности баз данных, работающих в сетях хостов, например MySQL, PostgreSQL и MongoDB.Топология SQL
Подключения
Задержка
Ошибки
Пропускная способность
Анализ SQL
Приложение - Redis Monitoring - K8SМониторинг команд Redis и производительности экземпляров Redis, работающих в Kubernetes Pod.Топология Redis
Подключения
Задержка
Ошибки
Пропускная способность
Анализ логов
Приложение - Redis Monitoring - CloudМониторинг команд Redis и производительности экземпляров Redis, работающих в сетях хостов.Топология Redis
Подключения
Задержка
Ошибки
Пропускная способность
Анализ логов
Приложение - Dubbo Monitoring - K8SМониторинг вызовов Dubbo RPC и производительности сервисов Dubbo, работающих в Kubernetes Pod.Топология Dubbo
Подключения
Задержка
Ошибки
Анализ логов
Автоматическое трассированиеРаспределенное трассированиеПредоставляет возможности распределенного трассирования для приложений, работающих в Kubernetes Pod, позволяя отслеживать запросы по мере их прохождения через различные сервисы и компоненты.Список запросов
Flame Graph
Распределенное трассирование - CloudПредоставляет возможности распределенного трассирования для приложений, работающих в сетях хостов, позволяя отслеживать запросы по мере их прохождения через различные сервисы и компоненты.Список запросов
Flame Graph

В итоге DeepFlow предлагает полный набор панелей для мониторинга и анализа производительности сети и приложений как в Kubernetes Pod, так и в сетях хостов.

  • Панели с префиксом Network предоставляют метрики уровня L4, а панели с префиксом Application — данные уровня L7.
  • Панели с суффиксом Cloud или содержащие Cloud Host в названии ориентированы на сети хостов, а панели с суффиксом K8s или без суффикса Cloud — на Kubernetes Pod.
  • Панели с суффиксом Map визуализируют топологию сетевых или прикладных компонентов.
  • Панели, содержащие Log в названии, отображают подробные логи сетевых потоков или запросов приложений.
  • Панели с Monitoring в названии фокусируются на конкретных протоколах или сервисах, таких как DNS, SQL, Redis и Dubbo.
  • Панели Distributed Tracing предоставляют возможности автоматического трассирования запросов приложений.

#Распределенное трассирование

Функция Distributed Tracing в DeepFlow позволяет отслеживать запросы по мере их прохождения через различные сервисы и компоненты ваших приложений.
Это помогает выявлять узкие места производительности, понимать взаимодействия сервисов и оптимизировать производительность приложений.

#Панели

В панелях Distributed Tracing вы можете просматривать подробную информацию о каждом запросе, включая:

  • Список запросов: список всех трассируемых запросов с их идентификаторами, временными метками, длительностью и статусами.
  • Flame Graph: визуальное представление стека вызовов для каждого запроса, показывающее время, затраченное в каждом сервисе или компоненте.

Вы можете фильтровать и искать конкретные запросы по различным критериям, таким как namespace, workload, trace ID, span ID, ресурс запроса и временной диапазон.
Пример списка запросов:

Distributed Tracing - Request List

Нажмите на конкретный запрос, чтобы просмотреть его подробную трассировку во Flame Graph:

Distributed Tracing - Flame Graph

Flame graph состоит из множества блоков в форме полосок, каждый из которых представляет span.
Ось X отображает время, а ось Y — глубину стека вызовов. Span отображаются сверху вниз в порядке вызова.

Детали:

  • Длина: по оси X представляет время выполнения span, каждый конец соответствует времени начала и окончания.
  • Список сервисов: показывает долю задержки, потребляемую каждым сервисом. Клик по сервису выделяет соответствующие span во Flame Graph.
    • Цвет: span приложений и системные span используют уникальный цвет для каждого сервиса; все сетевые span серые (так как не принадлежат никакому сервису).
  • Отображаемая информация: каждая полоска содержит иконку, информацию о вызове и время выполнения.
    • Иконка: различает типы span:
      • A Span приложения, собранный через протокол OpenTelemetry, охватывающий бизнес- и фреймворк-код.
      • S Системный span, собранный через eBPF с нулевым вторжением, охватывающий системные вызовы, функции приложений (например, HTTPS), API Gateway и Sidecar сервисной сетки.
      • N Сетевой span, собранный из сетевого трафика через BPF, охватывающий сетевые компоненты контейнеров, такие как iptables, ipvs, OvS и LinuxBridge.
    • Информация о вызове: зависит от типа span:
      • Application Span и System Span: протокол приложения, тип запроса и ресурс запроса.
      • Network Span: точка наблюдения.
    • Время выполнения: общее время с начала до конца span.
  • Операции: поддерживаются наведение и клик.
    • Наведение: отображает информацию о вызове, информацию об экземпляре и время выполнения во всплывающей подсказке.
      • Информация об экземпляре зависит от типа span:
        • Application Span: сервис и экземпляр ресурса.
        • System Span: процесс и экземпляр ресурса.
        • Network Span: сетевой интерфейс и экземпляр ресурса.
      • Время выполнения: общее время выполнения span и доля времени собственного выполнения.
    • Клик: выделяет span и его родительский span, а также позволяет просмотреть подробную информацию о выбранном span.
#Конфигурация

DeepFlow поддерживает парсинг уникальных Request ID, внедряемых приложениями (например, почти все шлюзы внедряют X-Request-ID), и связывает разные запросы с одинаковым Request ID в одну трассировку.
Чтобы добавить заголовок Request ID для парсинга, вы можете изменить конфигурацию группы агентов DeepFlow при установке или обновлении плагина DeepFlow.

Параметр конфигурации — processors.request_log.tag_extraction.tracing_tag.x_request_id, который принимает список имен заголовков.
Пример конфигурации:

processors:
  request_log:
    tag_extraction:
      tracing_tag:
        x_request_id:
          - x-request-id
          - x-bfe-log-id
          - stgw-request-id
          - x-blb-request-id

Для получения дополнительной информации о настройке агента DeepFlow обратитесь к документации DeepFlow Agent Configuration.

#Сценарии использования

  • Мониторинг производительности сети: используйте панели Network/L4 для мониторинга пропускной способности, потерь пакетов и производительности TCP на хостах кластера и Kubernetes Pod. Выявляйте узкие места и оптимизируйте сетевые настройки.
  • Мониторинг производительности приложений: используйте панели Application/L7 для мониторинга скорости запросов, количества ошибок и задержек различных приложений в вашем кластере. Выявляйте медленные конечные точки и оптимизируйте производительность приложений.
  • Визуализация топологии: используйте панели Map для визуализации топологии сети и приложений, что помогает понять взаимосвязи и зависимости между различными компонентами.
  • Анализ логов: используйте панели Log для анализа подробных логов потоков и запросов приложений, что помогает в устранении неполадок и получении информации о паттернах трафика.
  • Мониторинг протоколов: используйте панели Monitoring для мониторинга конкретных протоколов и сервисов, таких как DNS-запросы, производительность SQL-баз данных, команды Redis и вызовы Dubbo RPC.
  • Распределенное трассирование: используйте панели Distributed Tracing для отслеживания запросов по мере их прохождения через различные сервисы и компоненты, что помогает выявлять узкие места производительности и оптимизировать взаимодействия сервисов.

#Дополнительные ресурсы

  • DeepFlow - Instant Observability for Cloud & AI Applications
  • DeepFlow Agent Configuration
  • eBPF - Introduction, Tutorials & Community Resources