产品特性

服务网格是基于 Istio 的 PaaS 平台,为应用程序和微服务提供云原生解决方案。

该平台提供一键式基础设施部署和升级能力,可视化的服务治理、高效的应用性能管理以及服务网关管理的高可用性和性能。它为正在进行数字化转型的企业提供全面、稳定、可靠且开放的微服务解决方案,帮助提高服务治理效率,减少微服务框架的维护成本,同时降低开发人员对框架的依赖,使企业能够专注于业务发展,持续增强其核心竞争力。

服务网格全生命周期管理

在多集群环境中,管理服务网格变得特别复杂。服务网格的全生命周期管理不仅涉及部署、更新和删除服务网格,还包括实时监控其运行状态,使运维人员能够及时发现异常并进行故障排除,从而确保业务运营的一致性和稳定性支持。

特性描述
多主集群服务网格多主集群架构的服务网格管理功能可视化地展示微服务治理平台组件的部署过程。
服务网格的可视化部署和管理- 管理员可以通过可视化表单轻松部署所有微服务治理平台组件,包括 Istio,适用于每个需要服务治理能力的 Kubernetes 集群,同时可以根据需要集成外部组件以实现容器化微服务治理。
- 管理员可以根据实际业务规模自定义网格组件的资源配置。
服务网格监控服务网格监控功能包括多个内置监控仪表板,展示来自不同维度和粒度的控制平面和数据平面的监控数据,方便管理员实时查询或查看。

服务的全局可视化

特性描述
服务拓扑服务拓扑图直观地展示服务网格内服务与外部服务(例如,使用 OpenTelemetry Java Agent 注入的中间件、虚拟机服务)之间的关系。拓扑图有助于您了解哪些组件在通信,并迅速定位错误的准确位置。

- 关注从全局到局部,查看特定服务的详细信息,包括服务状态、请求状况、流量信息等。
- 当服务配置了安全性、熔断器和告警策略时,这些也会在拓扑图中以特殊标记显示。
- 通过节点颜色判断服务 Pods 的健康状态。
- 通过连接颜色判断服务之间流量的状态。
追踪该平台的追踪功能支持通过服务名称或 TraceID 查询当前命名空间中服务之间的调用链,监控调用链中服务的调用状态和持续时间等关键指标。结合详细的日志数据,这有助于开发人员了解业务请求链中每个节点或特定 API 的响应,以快速定位和解决问题。

- 便于开发和运维人员深入分析服务之间的调用。
- 显示从调用链的开始时间和持续时间抽象出的散点图,以快速识别低性能链接。
- 支持全链路追踪(服务网格架构中的服务、Java 8 及以上服务)。
- 通过 TraceID 快速定位调用链。
- 基于服务或 TraceID 查询链路信息。
服务网关服务网关,包括出口和入口网关,位于服务网格的边缘,管理进入和离开服务网格的流量,从而允许您指定允许的流量。

- 为服务网格配置多个入口或出口网关,每个网关允许通过多个可自定义端口访问。
- 入口网关支持通过多种路由场景将外部流量路由到不同的后端资源(API 组、服务);出口网关允许网格内的服务访问外部服务,而不影响开发体验,并对其流量进行监控。
- 支持多种使用场景,例如业务区域之间的网络隔离、特定业务的专属网关和端口隔离。
- 可以轻松退役不再需要的网关,而不会造成损失。
- 根据 JWT 进行客户端请求的身份验证和授权。
- 根据请求路径、请求头和 URI 重写配置网关路由规则。
- 支持 Pod 级网关监控,具有多种内置警报策略,帮助用户及时发现和解决问题。监控数据包括 CPU、内存、QPS、连接数、入站和出站流量指标。
原生资源列表允许熟悉 Kubernetes 的用户按资源类型查看 Istio 原生资源(YAML 文件)。

服务发布管理

集成了 Flagger,提供自动化的服务发布体验,支持多种部署策略,如 Canary、A/B 测试和蓝绿部署。

特性描述
发布配置定义服务发布配置,提供未来更改的模板执行参数,启用 Canary 版本 Pods 的自动化部署和回滚。
流量路由策略提供灵活的流量路由策略。服务可以根据发布配置模板自动路由流量或为特定发布任务自定义流量路由规则。
发布管理支撑手动和自动的发布选项。用户可以将发布决策委派给自动化系统,或者选择手动发布。发布流程允许手动干预,并随时回滚任务。
可观测性提供主版本与 Canary 版本之间的指标比较和追踪,支持对 Canary 发布的质量分析与故障定位。

服务安全治理

在微服务治理场景中,服务调用从本地转向网络协议接口调用,带来了安全风险。

特性描述
安全策略提供服务之间的流量加密。通过为服务设置安全策略,可以使用 mTLS 加密流量。

可视化服务运维

当服务发生故障时,通常的故障排查过程包括:跟踪异常流量 > 定位故障位置 > 收窄范围 > 分析具体原因。基于此过程,平台提供了完整的服务问题排查路径,帮助您基于异常流量快速定位可疑位置并及时解决问题,以最小化对业务的影响。

特性描述
流量监控和 JVM 监控提供多维度的客户端和服务器服务流量监控数据面板,粒度可细化到 API 级别;
- JVM 监控支持收集和显示各类指标(如 CPU/内存、线程和类)的监控数据。能够查看单个 Pod 的数据或比较两个 Pod 的数据,帮助开发人员迅速定位特定问题发生的指标项和时间点。
告警- 提供基于常见监控指标的告警功能,支持指标收集、策略管理、告警触发和告警通知。结合流量监控和 JVM 监控,旨在提供完整的 监控-告警-通知 智能运维体验。
- 提供告警策略配置模板,支持单一告警策略配置或通过模板快速创建告警策略。
- 通过 实时告警 面板概览当前处于告警状态的资源信息,按告警级别过滤数据,并查看告警详细信息,以帮助用户了解问题范围,快速定位根本原因。
实时日志提供服务级别的实时日志面板,允许您在发生服务异常时快速使用日志(包括访问日志)定位和排查问题。
快速故障排查当服务发生故障时,您可以结合丰富的可视化数据(服务拓扑图、追踪)和监控及运维数据(监控、告警、日志)跟踪和定位异常流量,迅速解决问题。

服务容灾

在多区域、多数据中心场景下,当某个数据中心的服务 Pod 故障并被熔断隔离时,平台将自动把客户端的流量分配到其他数据中心的服务 Pod,以确保服务的稳定提供。

特性描述
就近路由所有服务调用默认在所有数据中心中采用就近路由。当调用链节点较长时,能有效确保灾备流量优先由同一集群的服务端点处理。
自定义灾备优先级允许配置区域负载,以根据集群所处的区域定制灾备流量的灾备负载优先级。