介绍

目录

Pod 隔离介绍

Pod 隔离功能能够在保持 Pod 运行状态的同时,立即切断对故障 Pod 的流量。该功能:

  • 防止请求因故障 Pod 失败
  • 在故障排查期间保持服务可用性
  • 允许修复后无缝重新接入

核心目的:通过动态管理端点参与,确保服务连续性

优势

  • 快速隔离
    单击即可从服务网格中移除,无需终止 Pod

  • 稳定性保障
    通过排除故障实例,维持最佳成功率

  • K8s 原生集成
    兼容标准 Deployment 资源

  • 可观测性
    集成监控面板以验证健康状态

场景

  • 异常 Pod 处理
    隔离出现大量 5xx 错误或延迟激增的 Pod

  • 维护窗口
    基础设施更新期间临时移除节点

  • 性能调试
    在隔离 Pod 上测试修复方案,不影响生产流量

  • 滚动恢复
    验证后逐步重新引入修复的 Pod

限制

  • 状态限制
    仅影响 Running 状态的 Pod,不包括 Completed/CrashLoopBackOff

  • 版本兼容性
    旧版服务需更新标签(asm.cpaas.io/msselector)

  • 冲突场景
    灰度发布和水平扩缩容期间禁用

  • 持久性
    Pod 重启或缩容操作后隔离状态重置