Метрики трафика Istio

Платформа предоставляет большое количество данных по метрикам трафика, позволяя пользователям анализировать качество трафика сервисов с разных сторон.

Содержание

Требования

Сервис был инжектирован Sidecar, подробности см. в разделе Добавление сервисов.

Быстрый старт

  1. В левой навигационной панели нажмите Monitoring.

  2. Выберите сервис, для которого хотите просмотреть данные мониторинга, и временной диапазон.

    Примечание: Диапазон времени запроса ограничен периодом хранения данных мониторинга Prometheus. Например, если данные мониторинга хранятся до 7 дней, а установленный диапазон — последние 30 дней, статистика будет охватывать только 7 дней.

  3. Нажмите соответствующие вкладки для просмотра данных мониторинга трафика и мониторинга API трафика для сервиса.

    Пояснение: Когда сервисная сетка управляет несколькими кластерами, и в нескольких кластерах есть сервисы с одинаковым namespace и именем (сервисы без протокола Dubbo), панель мониторинга трафика отображает агрегированные данные мониторинга сервисов по всем кластерам.
    Для сравнения данных мониторинга сервиса в каждом кластере используйте панель Cluster Traffic Comparison.

Мониторинг трафика сервиса

Обычные операции

  • Обновление данных: Статистика мониторинга на текущей странице автоматически обновляется только один раз при открытии страницы. Чтобы обновить данные повторно, можно использовать два способа:

    • Ручное обновление: Нажмите в правом нижнем углу страницы для ручного обновления данных.

    • Установка автообновления (по умолчанию выключено): Нажмите для установки интервала автоматического обновления данных.

  • Просмотр/настройка легенды: Нажмите в правом верхнем углу графика, чтобы развернуть легенду на графике мониторинга. Клик по элементу легенды скрывает/показывает соответствующую кривую на графике.

  • Просмотр увеличенного графика мониторинга: Нажмите в правом верхнем углу графика для просмотра увеличенного и более детального графика мониторинга в всплывающем окне.

Пояснение к данным мониторинга

Протоколы HTTP/HTTP2/gRPC, Dubbo

Метрики мониторингаОписание
Среднее время откликаСреднее время отклика за выбранный период (общее время отклика / общее количество ответов).
Средний входящий/исходящий RPSСреднее значение входящего/исходящего RPS (запросов в секунду) за выбранный период.
Время откликаВремя отклика между сервисами или внутри сервиса, отображается как среднее, TP 50, TP 95, TP 99.
TP (Top Percentile) xx — минимальное время, за которое выполняется xx процентов сетевых запросов, часто используется в сценариях мониторинга производительности системы.
Наведение курсора на кривую показывает время отклика за конкретный период.
Входящий/исходящий RPSОбщее количество входящих/исходящих запросов в секунду и количество ошибочных входящих/исходящих запросов в секунду за выбранный период.
RPS = Количество запросов за период / Длительность периода (с).
Входящий/исходящий трафикОбщее количество входящих/исходящих запросов за выбранный период и доля трафика по HTTP-кодам ответа (нормальные/2xx, 3xx, 4xx, 5xx).
Наведение курсора на столбчатую диаграмму показывает долю трафика по каждой категории.
Сравнение трафика клиентовКлиент — это клиентский сервис (downstream), который делает запросы к текущему сервису (upstream). Сравнение трафика клиентов показывает и сравнивает Время отклика, Входящий RPS и входящий уровень ошибок RPS (ошибочные RPS / RPS) разных клиентов, вызывающих текущий сервис.

Пояснение:
- Неизвестный клиент — это совокупность клиентов (HTTP протокол) внутри сервисной сетки, вызывающих текущий сервис, трафик которых не управляется Sidecar.
- Если клиент принадлежит текущему namespace, нажатие на Trace рядом с именем клиента перенаправит на страницу трассировки.
- При наличии двух версий в canary-релизе отображаются агрегированные данные обеих версий.

Протокол TCP

Метрики мониторингаОписание
Входящий/исходящий трафикОбъем байтового потока входящего и исходящего трафика за выбранный период.
Средний входящий/исходящий трафикСреднее значение входящего/исходящего трафика (трафик / длительность) за выбранный период.
Входящий/исходящийСкорость передачи байтового потока входящего и исходящего сетевого трафика сервиса (байт в секунду).
TCP соединенияОбщее количество соединений.
Уровень ошибок = Количество неудачных соединений / Общее количество соединений
Уровень успешных соединений = Количество успешных соединений / Общее количество соединений
Наведение курсора на столбчатые диаграммы разных цветов показывает количество соединений в каждой категории.
Сравнение трафика клиентовСравнивает скорость передачи входящего байтового потока между сервисом и клиентскими сервисами, обращающимися к текущему сервису.

Мониторинг API трафика

Для обеспечения производительности системы мониторинга необходимо сначала задекларировать API сервиса на платформе. После этого платформа будет различать качество трафика задекларированных API в метриках трафика сервиса.

После успешного декларирования API сервиса можно выбрать API в соответствующей вкладке API Traffic Monitoring.

Пояснение к данным мониторинга

Совет: При просмотре данных можно использовать рекомендации из раздела Обычные операции для обновления данных мониторинга или скрытия данных по легенде.

  • Среднее время отклика: Среднее время отклика за выбранный период (общее время отклика / общее количество ответов).

  • Время отклика: Отображается как среднее, TP 50, TP 95, TP 99. Поддерживается просмотр времени отклика для одного значения. Наведение мыши на кривую показывает время отклика за конкретный период.
    TP xx — минимальное время, за которое выполняется xx процентов сетевых запросов, часто используется в сценариях мониторинга производительности системы.

  • Средний входящий RPS: Среднее значение RPS за выбранный период.

  • Входящий RPS: Запросы в секунду, отображается кривая трафика. Поддерживается просмотр общего RPS трафика или выбор отображения RPS ошибочного трафика.

  • Трафик: Отображает общее количество визитов, средний уровень успешных запросов и средний уровень ошибок за выбранный период. Цвета обозначают разные HTTP-коды статуса: темно-зеленый — успешные статусы (2XX), светло-зеленый — перенаправления (3XX), оранжевый — ошибки клиентских запросов (4XX), красный — ошибки сервера (5XX). Средний уровень ошибок = (4XX+5XX) / общий трафик × 100%.