介绍

Pod 隔离简介

Pod 隔离实现了对故障 Pods 的即时流量切断,同时保持它们的运行状态。此功能的特点:

  • 防止由于缺陷 Pods 导致的请求失败
  • 在故障排除期间保持服务可用性
  • 在修复后可无缝重新接入

核心目的:通过动态管理端点参与,确保服务连续性

优势

  • 快速隔离 单击即可从服务网格中移除,而无需终止 Pod

  • 稳定性保持 通过排除故障实例维持最佳成功率

  • K8s 原生集成 与标准的 Deployment 资源兼容

  • 可观察性 与监控仪表盘集成,用于健康验证

场景

  • 异常 Pod 处理 隔离出现高 5xx 错误或延迟尖峰的 Pods

  • 维护窗口 在基础设施更新期间暂时移除节点

  • 性能调试 在隔离的 Pod 上测试修复,而不会影响生产流量

  • 滚动恢复 在验证后逐步重新引入修复的 Pods

限制

  • 状态约束 仅影响运行中的 Pods,排除已完成/崩溃循环状态

  • 版本兼容性 传统服务需要更新标签(asm.cpaas.io/msselector)

  • 冲突场景 在金丝雀发布和水平扩展事件期间禁用

  • 持久性 在 Pod 重启或缩减操作时,隔离会重置