Метрики трафика Istio

Платформа предоставляет обширные данные по метрикам трафика, позволяя пользователям анализировать качество трафика сервисов с разных сторон.

Содержание

Предварительные требования

Сервис был инжектирован Sidecar, подробности см. в разделе Добавление сервисов.

Быстрый старт

  1. В левой навигационной панели нажмите Monitoring.

  2. Выберите сервис, для которого хотите просмотреть данные мониторинга, и временной диапазон.

    Примечание: Временной диапазон запроса ограничен периодом хранения данных мониторинга Prometheus. Например: если данные мониторинга хранятся до 7 дней, а установленный диапазон — последние 30 дней, статистика будет охватывать только 7 дней.

  3. Перейдите на соответствующие вкладки для просмотра данных мониторинга трафика и мониторинга API-трафика сервиса.

    Пояснение: Когда сервисная сетка управляет несколькими кластерами, и в нескольких кластерах есть сервисы с одинаковым namespace и именем (сервисы без протокола Dubbo), панель мониторинга трафика отображает агрегированные данные мониторинга сервисов по всем кластерам.
    Для сравнения данных мониторинга сервиса в каждом кластере используйте панель Cluster Traffic Comparison.

Мониторинг трафика сервиса

Обычные операции

  • Обновление данных: Статистика мониторинга на текущей странице автоматически обновляется только один раз при открытии страницы. Чтобы обновить данные повторно, можно использовать два способа:

    • Ручное обновление: нажмите в правом нижнем углу страницы для ручного обновления данных.

    • Установка автообновления (по умолчанию выключено): нажмите для настройки интервала автообновления данных.

  • Просмотр/настройка легенды: Нажмите в правом верхнем углу графика, чтобы развернуть легенду на графике мониторинга. Клик по элементу легенды скрывает/показывает соответствующую кривую на графике.

  • Просмотр увеличенного графика мониторинга: Нажмите в правом верхнем углу графика для просмотра увеличенного и более детального графика мониторинга в всплывающем окне.

Пояснение к данным мониторинга

Протоколы HTTP/HTTP2/gRPC, Dubbo

Метрики мониторингаОписание
Среднее время откликаСреднее время отклика за выбранный временной диапазон (общее время отклика / общее количество ответов).
Средний входящий/исходящий RPSСреднее значение входящего/исходящего RPS (запросов в секунду) за выбранный временной диапазон.
Время откликаВремя отклика между сервисами или внутри сервиса, отображается как среднее, TP 50, TP 95, TP 99.
TP (Top Percentile) xx означает минимальную длительность, в течение которой выполнено xx процентов сетевых запросов, часто используется в сценариях мониторинга производительности систем.
Наведение курсора на кривую показывает время отклика за конкретный период.
Входящий/исходящий RPSОбщее количество входящего/исходящего трафика в RPS и количество ошибочного входящего/исходящего трафика в RPS за выбранный временной диапазон.
RPS = Количество запросов за время запроса / Длительность запроса (с).
Входящий/исходящий трафикОбщее количество входящих/исходящих запросов за выбранный временной диапазон и доля трафика по HTTP-кодам возврата (нормальные/2xx, 3xx, 4xx, 5xx).
Наведение курсора на столбчатую диаграмму показывает долю трафика для каждой категории.
Сравнение трафика клиентовКлиент — это клиентский сервис (нижестоящий сервис), который делает запросы к текущему сервису (вышестоящему сервису). Сравнение трафика клиентов сравнивает и отображает Время отклика, Входящий RPS и входящий Уровень ошибок RPS (Error RPS/RPS) разных клиентов, вызывающих текущий сервис.

Пояснение:
- Неизвестный клиент — это совокупность клиентов (протокол HTTP) внутри сервисной сетки, которые вызывают текущий сервис, но трафик которых не управляется Sidecar.
- Если клиент принадлежит текущему namespace, нажатие на Trace рядом с именем клиента перенаправит на страницу трассировки.
- При наличии двух версий в сервисе canary release отображаются агрегированные данные обеих версий.

Протокол TCP

Метрики мониторингаОписание
Входящий/исходящий трафикРазмер входящего и исходящего байтового потока за выбранный временной диапазон.
Средний входящий/исходящий трафикСреднее значение входящего/исходящего трафика (трафик / длительность) за выбранный временной диапазон.
Входящий/исходящийСкорость передачи байтового потока входящего и исходящего сетевого трафика сервиса (байт в секунду).
TCP-соединенияОбщее количество соединений.
Уровень ошибок = Количество неудачных соединений / Общее количество соединений
Уровень успешных соединений = Количество успешных соединений / Общее количество соединений
Наведение курсора на столбчатые диаграммы разных цветов показывает количество соединений в каждой категории.
Сравнение трафика клиентовСравнивает скорость передачи входящего байтового потока между сервисом и клиентскими сервисами, обращающимися к текущему сервису.

Мониторинг API-трафика

Для обеспечения производительности системы мониторинга необходимо сначала объявить API сервиса на платформе. После этого платформа будет различать качество трафика объявленных API в метриках трафика сервиса.

После успешного объявления API сервиса вы можете выбрать API в соответствующем сервисе на вкладке мониторинга API-трафика.

Пояснение к данным мониторинга

Совет: Во время просмотра данных можно использовать рекомендации из раздела Обычные операции для обновления данных мониторинга или скрытия данных, соответствующих легенде.

  • Среднее время отклика: Среднее время отклика за выбранный временной диапазон (общее время отклика / общее количество ответов).

  • Время отклика: Отображается как среднее, TP 50, TP 95, TP 99. Поддерживается просмотр времени отклика для одного значения. Наведение мыши на кривую показывает время отклика за конкретный период.
    TP xx означает минимальную длительность, в течение которой выполнено xx процентов сетевых запросов, часто используется в сценариях мониторинга производительности систем.

  • Средний входящий RPS: Среднее значение RPS за выбранный временной диапазон.

  • Входящий RPS: Запросы в секунду, отображается кривая трафика. Поддерживается просмотр общего трафика RPS или выбор отображения ошибочного трафика RPS.

  • Трафик: Отображает общее количество посещений, средний уровень успешных запросов и средний уровень ошибок за выбранный временной диапазон. Цвета обозначают разные HTTP-коды состояния: темно-зеленый — успешные статусы (2XX), светло-зеленый — перенаправления (3XX), оранжевый — ошибки клиентских запросов (4XX), красный — ошибки сервера (5XX). Средний уровень ошибок = (4XX+5XX) / общий трафик × 100%.