Платформа предоставляет обширные данные по метрикам трафика, позволяя пользователям анализировать качество трафика сервисов с разных сторон.
Сервис был инжектирован Sidecar, подробности см. в разделе Добавление сервисов.
В левой навигационной панели нажмите Monitoring.
Выберите сервис, для которого хотите просмотреть данные мониторинга, и временной диапазон.
Примечание: Временной диапазон запроса ограничен периодом хранения данных мониторинга Prometheus. Например: если данные мониторинга хранятся до 7 дней, а установленный диапазон — последние 30 дней, статистика будет охватывать только 7 дней.
Перейдите на соответствующие вкладки для просмотра данных мониторинга трафика и мониторинга API-трафика сервиса.
Пояснение: Когда сервисная сетка управляет несколькими кластерами, и в нескольких кластерах есть сервисы с одинаковым namespace и именем (сервисы без протокола Dubbo), панель мониторинга трафика отображает агрегированные данные мониторинга сервисов по всем кластерам.
Для сравнения данных мониторинга сервиса в каждом кластере используйте панель Cluster Traffic Comparison.
Обновление данных: Статистика мониторинга на текущей странице автоматически обновляется только один раз при открытии страницы. Чтобы обновить данные повторно, можно использовать два способа:
Ручное обновление: нажмите в правом нижнем углу страницы для ручного обновления данных.
Установка автообновления (по умолчанию выключено): нажмите для настройки интервала автообновления данных.
Просмотр/настройка легенды: Нажмите в правом верхнем углу графика, чтобы развернуть легенду на графике мониторинга. Клик по элементу легенды скрывает/показывает соответствующую кривую на графике.
Просмотр увеличенного графика мониторинга: Нажмите в правом верхнем углу графика для просмотра увеличенного и более детального графика мониторинга в всплывающем окне.
Метрики мониторинга | Описание |
---|---|
Среднее время отклика | Среднее время отклика за выбранный временной диапазон (общее время отклика / общее количество ответов). |
Средний входящий/исходящий RPS | Среднее значение входящего/исходящего RPS (запросов в секунду) за выбранный временной диапазон. |
Время отклика | Время отклика между сервисами или внутри сервиса, отображается как среднее, TP 50, TP 95, TP 99. TP (Top Percentile) xx означает минимальную длительность, в течение которой выполнено xx процентов сетевых запросов, часто используется в сценариях мониторинга производительности систем. Наведение курсора на кривую показывает время отклика за конкретный период. |
Входящий/исходящий RPS | Общее количество входящего/исходящего трафика в RPS и количество ошибочного входящего/исходящего трафика в RPS за выбранный временной диапазон. RPS = Количество запросов за время запроса / Длительность запроса (с). |
Входящий/исходящий трафик | Общее количество входящих/исходящих запросов за выбранный временной диапазон и доля трафика по HTTP-кодам возврата (нормальные/2xx, 3xx, 4xx, 5xx). Наведение курсора на столбчатую диаграмму показывает долю трафика для каждой категории. |
Сравнение трафика клиентов | Клиент — это клиентский сервис (нижестоящий сервис), который делает запросы к текущему сервису (вышестоящему сервису). Сравнение трафика клиентов сравнивает и отображает Время отклика, Входящий RPS и входящий Уровень ошибок RPS (Error RPS/RPS) разных клиентов, вызывающих текущий сервис. Пояснение: - Неизвестный клиент — это совокупность клиентов (протокол HTTP) внутри сервисной сетки, которые вызывают текущий сервис, но трафик которых не управляется Sidecar. - Если клиент принадлежит текущему namespace, нажатие на Trace рядом с именем клиента перенаправит на страницу трассировки. - При наличии двух версий в сервисе canary release отображаются агрегированные данные обеих версий. |
Метрики мониторинга | Описание |
---|---|
Входящий/исходящий трафик | Размер входящего и исходящего байтового потока за выбранный временной диапазон. |
Средний входящий/исходящий трафик | Среднее значение входящего/исходящего трафика (трафик / длительность) за выбранный временной диапазон. |
Входящий/исходящий | Скорость передачи байтового потока входящего и исходящего сетевого трафика сервиса (байт в секунду). |
TCP-соединения | Общее количество соединений. Уровень ошибок = Количество неудачных соединений / Общее количество соединений Уровень успешных соединений = Количество успешных соединений / Общее количество соединений Наведение курсора на столбчатые диаграммы разных цветов показывает количество соединений в каждой категории. |
Сравнение трафика клиентов | Сравнивает скорость передачи входящего байтового потока между сервисом и клиентскими сервисами, обращающимися к текущему сервису. |
Для обеспечения производительности системы мониторинга необходимо сначала объявить API сервиса на платформе. После этого платформа будет различать качество трафика объявленных API в метриках трафика сервиса.
После успешного объявления API сервиса вы можете выбрать API в соответствующем сервисе на вкладке мониторинга API-трафика.
Совет: Во время просмотра данных можно использовать рекомендации из раздела Обычные операции для обновления данных мониторинга или скрытия данных, соответствующих легенде.
Среднее время отклика: Среднее время отклика за выбранный временной диапазон (общее время отклика / общее количество ответов).
Время отклика: Отображается как среднее, TP 50, TP 95, TP 99. Поддерживается просмотр времени отклика для одного значения. Наведение мыши на кривую показывает время отклика за конкретный период.
TP xx означает минимальную длительность, в течение которой выполнено xx процентов сетевых запросов, часто используется в сценариях мониторинга производительности систем.
Средний входящий RPS: Среднее значение RPS за выбранный временной диапазон.
Входящий RPS: Запросы в секунду, отображается кривая трафика. Поддерживается просмотр общего трафика RPS или выбор отображения ошибочного трафика RPS.
Трафик: Отображает общее количество посещений, средний уровень успешных запросов и средний уровень ошибок за выбранный временной диапазон. Цвета обозначают разные HTTP-коды состояния: темно-зеленый — успешные статусы (2XX), светло-зеленый — перенаправления (3XX), оранжевый — ошибки клиентских запросов (4XX), красный — ошибки сервера (5XX). Средний уровень ошибок = (4XX+5XX) / общий трафик × 100%.