Service Mesh 是基于 Istio 的 PaaS 平台,为应用和微服务提供云原生解决方案。
该平台提供一键式基础设施部署与升级能力、可视化的服务治理、高效的应用性能管理,以及高可用高性能的服务网关管理。它为数字化转型中的企业提供全面、稳定、可靠且开放的微服务解决方案,帮助提升服务治理效率,降低微服务框架的维护成本,同时最大限度减少开发者对框架的依赖,使企业能够专注于业务发展,持续增强核心竞争力。
在多集群环境下,管理服务网格尤为复杂。服务网格的全生命周期管理不仅包括部署、更新和删除服务网格,还包括实时监控其运行状态,使运维人员能够及时发现异常并排查问题,从而确保业务运行的持续稳定支持。
功能 | 描述 |
---|---|
多主集群服务网格 | 多主集群架构的服务网格管理功能可视化展示微服务治理平台组件的部署过程。 |
服务网格的可视化部署与管理 | - 管理员可通过可视化表单轻松部署每个需要服务治理能力的 Kubernetes 集群的所有微服务治理平台组件,包括 Istio,并配置关键参数。也可根据需要集成外部组件,实现容器化微服务治理。 - 管理员可根据实际业务规模自定义网格组件的资源配置。 |
服务网格监控 | 服务网格监控功能包含多个内置监控面板,从不同维度和粒度展示控制平面和数据平面的监控数据,方便管理员实时查询或查看。 |
功能 | 描述 |
---|---|
服务拓扑 | 服务拓扑图直观展示服务网格内服务之间以及网格内外服务(如注入了 OpenTelemetry Java Agent 的中间件、虚拟机服务)之间的关系。拓扑图帮助您了解哪些组件相互通信,并快速定位错误的具体位置。 - 支持从全局聚焦到局部,查看特定服务的详细信息,包括服务状态、请求情况、流量信息等。 - 当服务配置了安全、熔断和告警策略时,这些也会在拓扑图中以特殊标记显示。 - 通过节点颜色判断服务 Pod 的健康状态。 - 通过连接颜色判断服务间流量状态。 |
Tracing | 平台的追踪功能支持通过服务名或 TraceID 查询当前命名空间内服务间的调用链,监控调用链中服务的调用状态和时长等关键指标。结合详细的日志数据,帮助开发者了解业务请求链中每个节点或具体 API 的响应情况,实现快速定位和解决问题。 - 方便开发和运维人员深入分析服务间调用。 - 显示基于调用链起始时间和持续时间抽象的散点图,快速识别性能瓶颈。 - 支持全链路追踪(Service Mesh 架构内服务、Java 8+ 服务)。 - 通过 TraceID 快速定位调用链。 - 支持基于服务或 TraceID 查询链路信息。 |
服务网关 | 服务网关包括出口网关和入口网关,位于服务网格边缘,管理进入和离开服务网格的流量,允许您指定允许的流量。 - 可为服务网格配置多个入口或出口网关,每个网关支持通过多个可自定义端口访问。 - 入口网关支持通过多种路由场景将外部流量路由到不同的后端资源(API 组、服务);出口网关允许网格内服务访问外部服务,不影响开发体验,并监控对外流量。 - 支持多种使用场景,如业务域间网络隔离、特定业务专用网关、端口隔离等。 - 可轻松下线不再需要的网关,且无损失。 - 基于 JWT 认证和授权客户端请求。 - 支持基于请求路径、请求头和 URI 重写配置网关路由规则。 - 支持 Pod 级别网关监控,内置多种告警策略,帮助用户及时发现和解决问题。监控数据包括 CPU、内存、QPS、连接数、进出流量指标。 |
原生资源列表 | 允许熟悉 Kubernetes 的用户按资源类型查看 Istio 原生资源(YAML 文件)。 |
集成 Flagger,提供自动化的服务发布体验,支持 Canary、A/B 测试和蓝绿发布等多种部署策略。
功能 | 描述 |
---|---|
发布配置 | 定义服务发布配置,为后续变更提供模板化执行参数,实现 Canary 版本 Pod 的自动部署和回滚。 |
流量路由策略 | 提供灵活的流量路由策略。服务可基于发布配置模板自动路由流量,或为特定发布任务自定义流量路由规则。 |
发布管理 | 支持手动和自动发布两种方式。用户可将发布决策交由自动化系统,也可选择手动发布。发布过程支持人工干预,并可随时回滚任务。 |
可观测性 | 提供主版本与 Canary 版本间的指标对比和追踪跟踪,实现 Canary 发布的质量分析和故障定位。 |
在微服务治理场景中,服务调用由本地调用转变为网络协议接口调用,带来安全风险。
功能 | 描述 |
---|---|
安全策略 | 提供服务间流量加密。通过为服务设置安全策略,实现基于 mTLS 的流量加密。 |
当服务发生故障时,常规排查流程为:追踪异常流量 > 定位故障位置 > 缩小排查范围 > 分析具体原因。基于此流程,平台提供完整的服务问题排查路径,帮助您基于异常流量快速定位可疑位置,及时解决问题,最大限度减少业务影响。
功能 | 描述 |
---|---|
流量监控与 JVM 监控 | 提供客户端和服务端服务的多维度流量监控数据面板,粒度细化至 API 级别; - JVM 监控支持采集并展示 CPU/内存、线程、类等多种指标的监控数据。支持查看单个 Pod 数据或对比两个 Pod 数据,帮助开发者快速定位具体指标项和时间点的异常。 |
告警 | - 基于常用监控指标提供告警功能,支持指标采集、策略管理、告警触发和告警通知。结合流量监控和 JVM 监控,旨在提供完整的监控-告警-通知智能运维体验。 - 提供告警策略配置模板,支持单条告警策略配置或通过模板快速创建告警策略。 - 通过实时告警面板概览当前告警资源信息,可按告警级别筛选数据,查看告警详情,帮助用户了解问题范围并快速定位根因。 |
实时日志 | 提供服务级别的实时日志面板,服务异常时可通过日志(包括访问日志)快速定位和排查问题。 |
快速排查 | 服务故障发生时,可结合丰富的可视化数据(服务拓扑、Tracing)和监控运维数据(监控、告警、日志)追踪定位异常流量,快速解决问题。 |
在多地域、多数据中心场景下,当某数据中心的服务 Pod 发生故障并被熔断隔离时,平台会自动将客户端流量分发至其他数据中心的服务 Pod,确保服务稳定提供。
功能 | 描述 |
---|---|
就近路由 | 所有服务调用默认在所有数据中心采用就近路由。当调用链节点较长时,有效保证灾备流量优先由同集群的服务端点处理。 |
自定义容灾优先级 | 支持配置地域负载,自定义跨多个集群的容灾流量优先级,基于集群所在地域进行调度。 |