Платформа предоставляет большое количество данных по метрикам трафика, позволяя пользователям анализировать качество трафика сервисов с разных сторон.
Сервис был инжектирован Sidecar, подробности см. в разделе Добавление сервисов.
В левой навигационной панели нажмите Monitoring.
Выберите сервис, для которого хотите просмотреть данные мониторинга, и временной диапазон.
Примечание: Диапазон времени запроса ограничен периодом хранения данных мониторинга Prometheus. Например, если данные мониторинга хранятся до 7 дней, а установленный диапазон — последние 30 дней, статистика будет охватывать только 7 дней.
Нажмите соответствующие вкладки для просмотра данных мониторинга трафика и мониторинга API трафика для сервиса.
Пояснение: Когда сервисная сетка управляет несколькими кластерами, и в нескольких кластерах есть сервисы с одинаковым namespace и именем (сервисы без протокола Dubbo), панель мониторинга трафика отображает агрегированные данные мониторинга сервисов по всем кластерам.
Для сравнения данных мониторинга сервиса в каждом кластере используйте панель Cluster Traffic Comparison.
Обновление данных: Статистика мониторинга на текущей странице автоматически обновляется только один раз при открытии страницы. Чтобы обновить данные повторно, можно использовать два способа:
Ручное обновление: Нажмите в правом нижнем углу страницы для ручного обновления данных.
Установка автообновления (по умолчанию выключено): Нажмите для установки интервала автоматического обновления данных.
Просмотр/настройка легенды: Нажмите в правом верхнем углу графика, чтобы развернуть легенду на графике мониторинга. Клик по элементу легенды скрывает/показывает соответствующую кривую на графике.
Просмотр увеличенного графика мониторинга: Нажмите в правом верхнем углу графика для просмотра увеличенного и более детального графика мониторинга в всплывающем окне.
Метрики мониторинга | Описание |
---|---|
Среднее время отклика | Среднее время отклика за выбранный период (общее время отклика / общее количество ответов). |
Средний входящий/исходящий RPS | Среднее значение входящего/исходящего RPS (запросов в секунду) за выбранный период. |
Время отклика | Время отклика между сервисами или внутри сервиса, отображается как среднее, TP 50, TP 95, TP 99. TP (Top Percentile) xx — минимальное время, за которое выполняется xx процентов сетевых запросов, часто используется в сценариях мониторинга производительности системы. Наведение курсора на кривую показывает время отклика за конкретный период. |
Входящий/исходящий RPS | Общее количество входящих/исходящих запросов в секунду и количество ошибочных входящих/исходящих запросов в секунду за выбранный период. RPS = Количество запросов за период / Длительность периода (с). |
Входящий/исходящий трафик | Общее количество входящих/исходящих запросов за выбранный период и доля трафика по HTTP-кодам ответа (нормальные/2xx, 3xx, 4xx, 5xx). Наведение курсора на столбчатую диаграмму показывает долю трафика по каждой категории. |
Сравнение трафика клиентов | Клиент — это клиентский сервис (downstream), который делает запросы к текущему сервису (upstream). Сравнение трафика клиентов показывает и сравнивает Время отклика, Входящий RPS и входящий уровень ошибок RPS (ошибочные RPS / RPS) разных клиентов, вызывающих текущий сервис. Пояснение: - Неизвестный клиент — это совокупность клиентов (HTTP протокол) внутри сервисной сетки, вызывающих текущий сервис, трафик которых не управляется Sidecar. - Если клиент принадлежит текущему namespace, нажатие на Trace рядом с именем клиента перенаправит на страницу трассировки. - При наличии двух версий в canary-релизе отображаются агрегированные данные обеих версий. |
Метрики мониторинга | Описание |
---|---|
Входящий/исходящий трафик | Объем байтового потока входящего и исходящего трафика за выбранный период. |
Средний входящий/исходящий трафик | Среднее значение входящего/исходящего трафика (трафик / длительность) за выбранный период. |
Входящий/исходящий | Скорость передачи байтового потока входящего и исходящего сетевого трафика сервиса (байт в секунду). |
TCP соединения | Общее количество соединений. Уровень ошибок = Количество неудачных соединений / Общее количество соединений Уровень успешных соединений = Количество успешных соединений / Общее количество соединений Наведение курсора на столбчатые диаграммы разных цветов показывает количество соединений в каждой категории. |
Сравнение трафика клиентов | Сравнивает скорость передачи входящего байтового потока между сервисом и клиентскими сервисами, обращающимися к текущему сервису. |
Для обеспечения производительности системы мониторинга необходимо сначала задекларировать API сервиса на платформе. После этого платформа будет различать качество трафика задекларированных API в метриках трафика сервиса.
После успешного декларирования API сервиса можно выбрать API в соответствующей вкладке API Traffic Monitoring.
Совет: При просмотре данных можно использовать рекомендации из раздела Обычные операции для обновления данных мониторинга или скрытия данных по легенде.
Среднее время отклика: Среднее время отклика за выбранный период (общее время отклика / общее количество ответов).
Время отклика: Отображается как среднее, TP 50, TP 95, TP 99. Поддерживается просмотр времени отклика для одного значения. Наведение мыши на кривую показывает время отклика за конкретный период.
TP xx — минимальное время, за которое выполняется xx процентов сетевых запросов, часто используется в сценариях мониторинга производительности системы.
Средний входящий RPS: Среднее значение RPS за выбранный период.
Входящий RPS: Запросы в секунду, отображается кривая трафика. Поддерживается просмотр общего RPS трафика или выбор отображения RPS ошибочного трафика.
Трафик: Отображает общее количество визитов, средний уровень успешных запросов и средний уровень ошибок за выбранный период. Цвета обозначают разные HTTP-коды статуса: темно-зеленый — успешные статусы (2XX), светло-зеленый — перенаправления (3XX), оранжевый — ошибки клиентских запросов (4XX), красный — ошибки сервера (5XX). Средний уровень ошибок = (4XX+5XX) / общий трафик × 100%.