• Русский
  • Метрики трафика OpenTelemetry

    Платформа предоставляет обширные данные по метрикам трафика, позволяя пользователям анализировать качество обслуживания трафика с различных сторон.

    Содержание

    Мониторинг трафика сервисов

    Просмотр качества трафика сервиса

    Требования

    Сервис был инжектирован с помощью Java Agent, подробности реализации см. в разделе Добавление сервисов.

    Шаги

    1. В левой навигационной панели нажмите Monitoring.

    2. Выберите сервис и временной диапазон, за который хотите просмотреть данные мониторинга.

      Примечание: Временной диапазон запроса ограничен периодом хранения данных мониторинга Prometheus. Например, если данные мониторинга хранятся до 7 дней, а установленный временной диапазон — последние 30 дней, статистика будет охватывать только 7 дней.

    3. Нажмите соответствующие вкладки для просмотра данных мониторинга трафика сервиса и мониторинга JVM.

    Регулярные операции

    • Обновление данных: Статистика мониторинга на текущей странице автоматически обновляется только один раз при открытии страницы. Для повторного обновления доступны два способа:

      • Ручное обновление: Нажмите в правом нижнем углу страницы для ручного обновления данных.

      • Установка автообновления (по умолчанию выключено): Нажмите для настройки интервала автоматического обновления данных.

    • Просмотр/настройка легенды: Нажмите в правом верхнем углу графика, чтобы развернуть легенду на графике мониторинга. Клик по элементу легенды скрывает или показывает соответствующую кривую на графике.

    • Просмотр увеличенного графика мониторинга: Нажмите в правом верхнем углу графика для просмотра увеличенного и более детального графика мониторинга в всплывающем окне.

    Объяснение данных мониторинга

    Метрики мониторингаОписание
    Среднее время откликаСреднее время отклика за выбранный временной диапазон (общее время отклика / общее количество ответов).
    Средний входящий/исходящий RPSСреднее значение входящего/исходящего RPS (запросов в секунду) за выбранный временной диапазон.
    Время откликаВремя отклика между сервисами или внутри сервиса, отображается как среднее, TP 50, TP 95, TP 99.
    TP (Top Percentile) xx означает минимальную длительность, в течение которой выполняется xx процентов сетевых запросов, обычно используется в сценариях мониторинга производительности систем.
    Наведение курсора на кривую показывает время отклика за конкретный период.
    Входящий/исходящий RPSОбщее количество входящего/исходящего трафика в RPS и количество ошибочного входящего/исходящего трафика в RPS за выбранный временной диапазон.
    RPS = Количество запросов за время запроса / Длительность запроса (с).
    Входящий/исходящий трафикОбщее количество входящих/исходящих запросов за выбранный временной диапазон и доля трафика по HTTP-кодам возврата (нормальные/2xx, 3xx, 4xx, 5xx).
    Наведение курсора на столбчатую диаграмму показывает долю трафика для каждой категории.
    Сравнение трафика клиентовКлиент — это клиентский сервис (нижестоящий сервис), который делает запросы к текущему сервису (вышестоящий сервис). Сравнение трафика клиентов отображает и сравнивает Время отклика, Входящий RPS и входящий Уровень ошибок RPS (Error RPS/RPS) различных клиентов, вызывающих текущий сервис.

    Пояснение:
    - unknown client — это совокупность клиентов (HTTP-протокол) внутри сервис-меша, которые вызывают текущий сервис и трафик которых не управляется OpenTelemetry.
    - Если клиент принадлежит текущему namespace, нажатие на Trace рядом с именем клиента перенаправит на страницу трассировки.