• Русский
  • Метрики трафика OpenTelemetry

    Платформа предоставляет обширные данные по метрикам трафика, позволяя пользователям анализировать качество сервисного трафика с различных сторон.

    Мониторинг сервисного трафика

    Просмотр качества сервисного трафика

    Предварительные условия

    Сервис был внедрен с помощью Java Agent, подробности реализации см. в разделе Добавление сервисов.

    Шаги

    1. В левой навигационной панели нажмите Monitoring.

    2. Выберите сервис и временной диапазон, за который хотите просмотреть данные мониторинга.

      Примечание: Временной диапазон запроса ограничен периодом хранения данных мониторинга Prometheus. Например, если данные мониторинга хранятся до 7 дней, а установленный временной диапазон — последние 30 дней, статистика будет охватывать только 7 дней.

    3. Нажмите соответствующие вкладки для просмотра данных мониторинга трафика сервиса и мониторинга JVM.

    Регулярные операции

    • Обновление данных: Статистика мониторинга на текущей странице автоматически обновляется только один раз при открытии страницы. Для повторного обновления можно использовать два способа:

      • Ручное обновление: Нажмите в правом нижнем углу страницы для ручного обновления данных.

      • Установка автообновления (по умолчанию выключено): Нажмите для установки интервала автоматического обновления данных.

    • Просмотр/настройка легенды: Нажмите в правом верхнем углу графика, чтобы развернуть легенду на графике мониторинга. Нажатие на элемент легенды скрывает или отображает соответствующую кривую на графике.

    • Просмотр увеличенного графика мониторинга: Нажмите в правом верхнем углу графика для просмотра увеличенного и более детального графика мониторинга в всплывающем окне.

    Объяснение данных мониторинга

    Метрики мониторингаОписание
    Среднее время откликаСреднее время отклика за выбранный временной диапазон (общее время отклика / общее количество откликов).
    Среднее входящее/исходящее RPSСреднее значение входящего/исходящего RPS (запросов в секунду) за выбранный временной диапазон.
    Время откликаВремя отклика между сервисами или внутри сервиса, отображается как среднее, TP 50, TP 95, TP 99.
    TP (Top Percentile) xx означает минимальную длительность, в течение которой выполняется xx процентов сетевых запросов, часто используется в сценариях мониторинга производительности системы.
    Наведение курсора на кривую позволяет увидеть время отклика за конкретный период.
    Входящий/исходящий RPSОбщее количество входящего/исходящего трафика в RPS и количество ошибочного входящего/исходящего трафика в RPS за выбранный временной диапазон.
    RPS = Количество запросов за время запроса / Длительность запроса (с).
    Входящий/исходящий трафикОбщее количество входящих/исходящих запросов за выбранный временной диапазон и доля трафика по HTTP-кодам возврата (нормальные/2xx, 3xx, 4xx, 5xx).
    Наведение курсора на столбчатую диаграмму позволяет увидеть долю трафика по каждой категории.
    Сравнение клиентского трафикаКлиент — это клиентский сервис (нижестоящий сервис), который делает запросы к текущему сервису (вышестоящий сервис). Сравнение клиентского трафика сравнивает и отображает Время отклика, Входящий RPS и входящий Уровень ошибок RPS (Error RPS/RPS) различных клиентов, вызывающих текущий сервис.

    Пояснение:
    - unknown client — это совокупность клиентов (HTTP-протокол) внутри сервисной сетки, которые вызывают текущий сервис, но трафик которых не управляется OpenTelemetry.
    - Если клиент принадлежит текущему namespace, нажатие на Trace рядом с именем клиента перенаправит на страницу трассировки.