OpenTelemetry Traffic Metrics

Платформа предоставляет обширные данные по метрикам трафика, позволяя пользователям анализировать качество сервисного трафика с различных сторон.

Содержание

Мониторинг сервисного трафика

Просмотр качества сервисного трафика

Требования

Сервис был внедрён с помощью Java Agent, подробности реализации см. в разделе Adding Services.

Шаги

  1. В левой навигационной панели нажмите Monitoring.

  2. Выберите сервис и временной диапазон, за который хотите просмотреть данные мониторинга.

    Примечание: Временной диапазон запроса ограничен периодом хранения данных мониторинга Prometheus. Например, если данные мониторинга хранятся до 7 дней, а выбранный временной диапазон — последние 30 дней, статистика будет охватывать только 7 дней.

  3. Нажмите соответствующие вкладки для просмотра данных мониторинга трафика сервиса и мониторинга JVM.

Регулярные операции

  • Обновление данных: Статистика мониторинга на текущей странице автоматически обновляется только один раз при открытии страницы. Для повторного обновления доступны два способа:

    • Ручное обновление: Нажмите в правом нижнем углу страницы для ручного обновления данных.

    • Установка автообновления (по умолчанию выключено): Нажмите для установки интервала автоматического обновления данных.

  • Просмотр/настройка легенды: Нажмите в правом верхнем углу графика, чтобы развернуть легенду на графике мониторинга. Клик по элементу легенды скрывает/показывает соответствующую кривую на графике.

  • Просмотр графика мониторинга в увеличенном виде: Нажмите в правом верхнем углу графика для просмотра увеличенного и более детального графика мониторинга в всплывающем окне.

Объяснение данных мониторинга

Метрики мониторингаОписание
Среднее время откликаСреднее время отклика за выбранный временной диапазон (общее время отклика / общее количество ответов).
Средний входящий/исходящий RPSСреднее значение входящего/исходящего RPS (запросов в секунду) за выбранный временной диапазон.
Время откликаВремя отклика между сервисами или внутри сервиса, отображается как среднее, TP 50, TP 95, TP 99.
TP (Top Percentile) xx означает минимальную продолжительность, в течение которой выполняется xx процентов сетевых запросов, часто используется в сценариях мониторинга производительности систем.
Наведение курсора на кривую показывает время отклика за конкретный период.
Входящий/исходящий RPSОбщее количество входящего/исходящего трафика в RPS и количество ошибок входящего/исходящего трафика в RPS за выбранный временной диапазон.
RPS = Количество запросов за время запроса / Длительность запроса (с).
Входящий/исходящий трафикОбщее количество входящих/исходящих запросов за выбранный временной диапазон и доля трафика по HTTP-кодам возврата (нормальные/2xx, 3xx, 4xx, 5xx).
Наведение курсора на столбчатую диаграмму показывает долю трафика для каждой категории.
Сравнение клиентского трафикаКлиент — это клиентский сервис (нижестоящий сервис), который делает запросы к текущему сервису (вышестоящий сервис). Сравнение клиентского трафика сравнивает и отображает Время отклика, Входящий RPS и входящий Уровень ошибок RPS (Error RPS / RPS) различных клиентов, вызывающих текущий сервис.

Пояснение:
- unknown client — это совокупность клиентов (HTTP-протокол) внутри сервисной сетки, которые вызывают текущий сервис, но чей трафик не управляется OpenTelemetry.
- Если клиент принадлежит текущему namespace, нажатие на Trace рядом с именем клиента перенаправит на страницу трассировки.