简体中文

配置 VerticalPodAutoscaler (VPA)

对于无状态和有状态应用，VerticalPodAutoscaler (VPA) 会根据您的业务需求自动推荐并可选地应用更合适的 CPU 和内存资源限制，确保 Pod 拥有足够的资源，同时提升集群资源利用率。

了解 VerticalPodAutoscalers

您可以创建一个 VerticalPodAutoscaler，根据 Pod 的历史使用模式推荐或自动更新其 CPU 和内存资源请求与限制。

创建 VerticalPodAutoscaler 后，平台开始监控 Pod 的 CPU 和内存资源使用情况。当收集到足够数据时，VerticalPodAutoscaler 会基于观察到的使用模式计算推荐的资源值。根据配置的更新模式，VPA 可以自动应用这些推荐，或仅提供推荐供手动应用。

VPA 通过分析 Pod 的资源使用情况并基于此分析提出建议，帮助确保 Pod 拥有所需资源，避免资源过度配置，从而实现集群资源的更高效利用。

VPA 是如何工作的？

VerticalPodAutoscaler (VPA) 扩展了 Pod 资源优化的概念。VPA 监控 Pod 的资源使用情况，并基于观察到的使用模式提供 CPU 和内存请求的推荐。

VPA 通过持续监控 Pod 的资源使用情况，并随着新数据的产生不断更新推荐。VPA 可运行于以下模式：

Off：VPA 仅提供推荐，不自动应用。
Manual Adjustment：您可以根据 VPA 推荐手动调整资源配置。

重要提示：弹性伸缩可以实现 Pod 的水平或垂直伸缩。当资源充足时，弹性伸缩效果良好；但当集群资源不足时，可能导致 Pod 处于 Pending 状态。因此，请确保集群资源充足或配额合理，或配置告警以监控伸缩情况。

支持的功能

VerticalPodAutoscaler 基于历史使用模式提供资源推荐，帮助您优化 Pod 的 CPU 和内存配置。

重要提示：手动应用 VPA 推荐时会触发 Pod 重建，可能导致应用短暂中断。建议在生产环境的维护窗口期间应用推荐。

前提条件

请确保当前集群已部署监控组件且运行正常。您可以点击平台右上角 > 平台健康状态 查看监控组件的部署和健康状态。
集群中必须安装 Alauda Container Platform Vertical Pod Autoscaler 集群插件。

安装 Vertical Pod Autoscaler 插件

使用 VPA 之前，需先安装 Vertical Pod Autoscaler 集群插件：

登录并进入 Administrators 页面。
点击 Marketplace > Cluster Plugins，进入 Cluster Plugins 列表页面。
找到 Alauda Container Platform Vertical Pod Autoscaler 集群插件，点击安装，进入安装页面。

创建 VerticalPodAutoscaler

使用 CLI

您可以通过命令行界面定义 YAML 文件并使用 kubectl create 命令创建 VerticalPodAutoscaler。以下示例展示了针对 Deployment 对象的垂直 Pod 自动伸缩：

创建名为 vpa.yaml 的 YAML 文件，内容如下：
```
apiVersion: autoscaling.k8s.io/v1
kind: VerticalPodAutoscaler
metadata:
  name: my-deployment-vpa
  namespace: default
spec:
  targetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: my-deployment
  updatePolicy:
    updateMode: 'Off'
  resourcePolicy:
    containerPolicies:
      - containerName: '*'
        mode: 'Auto'
```
1. 使用 autoscaling.k8s.io/v1 API。
2. VPA 的名称。
3. 指定目标工作负载对象。VPA 使用工作负载的选择器查找需要调整资源的 Pod。支持的工作负载类型包括 DaemonSet、Deployment、ReplicaSet、StatefulSet、ReplicationController、Job 和 CronJob。
4. 指定要伸缩对象的 API 版本。
5. 指定对象类型。
6. VPA 应用的目标资源。
7. 定义 VPA 如何应用推荐的更新策略。updateMode 可选值：
  - Auto：创建 Pod 时自动设置资源请求，并更新当前 Pod 至推荐资源请求。目前等同于 “Recreate”。此模式可能导致应用停机。未来支持就地更新后，“Auto” 模式将采用该更新机制。
  - Recreate：创建 Pod 时自动设置资源请求，并驱逐当前 Pod 以更新至推荐资源请求。不使用就地更新。
  - Initial：仅在创建 Pod 时设置资源请求，之后不做修改。
  - Off：不自动修改 Pod 资源请求，仅在 VPA 对象中提供推荐。
8. 资源策略，可为不同容器设置具体策略。例如，将容器模式设为 “Auto” 表示为该容器计算推荐，设为 “Off” 表示不计算推荐。
9. 应用于 Pod 中所有容器的策略。
10. 设置模式为 Auto 或 Off。Auto 表示为该容器生成推荐，Off 表示不生成推荐。

应用 YAML 文件创建 VPA：

kubectl create -f vpa.yaml

示例输出：

verticalpodautoscaler.autoscaling.k8s.io/my-deployment-vpa created

创建 VPA 后，可运行以下命令查看推荐：

kubectl describe vpa my-deployment-vpa

示例输出（部分）：

Status:
  Recommendation:
    Container Recommendations:
      Container Name:  my-container
      Lower Bound:
        Cpu:     100m
        Memory:  262144k
      Target:
        Cpu:     200m
        Memory:  524288k
      Upper Bound:
        Cpu:     300m
        Memory:  786432k

使用 Web 控制台

进入 Container Platform。
在左侧导航栏点击 Workloads > Deployments。
点击 Deployment 名称。
向下滚动至 弹性伸缩 区域，点击右侧的更新。

选择 垂直伸缩 并配置伸缩规则。

参数	说明
伸缩模式	目前支持手动伸缩模式，通过分析过去的资源使用情况提供推荐的资源配置，您可以根据推荐值手动调整。调整会导致 Pod 重建和重启，请选择合适时间以避免影响运行中的应用。通常，Pod 运行超过 8 天后，推荐值会更准确。注意，当集群资源不足时，伸缩可能导致 Pod 处于 Pending 状态。请确保集群资源充足或配额合理，或配置告警监控伸缩情况。
目标容器	默认为工作负载的第一个容器。您可以根据需要选择为一个或多个容器启用资源限制推荐。

参数

说明

伸缩模式

目前支持 手动伸缩 模式，通过分析过去的资源使用情况提供推荐的资源配置，您可以根据推荐值手动调整。调整会导致 Pod 重建和重启，请选择合适时间以避免影响运行中的应用。
通常，Pod 运行超过 8 天后，推荐值会更准确。
注意，当集群资源不足时，伸缩可能导致 Pod 处于 Pending 状态。请确保集群资源充足或配额合理，或配置告警监控伸缩情况。

目标容器

默认为工作负载的第一个容器。您可以根据需要选择为一个或多个容器启用资源限制推荐。

点击更新。

高级 VPA 配置

更新策略选项

updateMode: "Off" - VPA 仅提供推荐，不自动应用。您可根据需要手动应用推荐。
updateMode: "Auto" - 创建 Pod 时自动设置资源请求，并更新当前 Pod 至推荐值。目前等同于 “Recreate”。
updateMode: "Recreate" - 创建 Pod 时自动设置资源请求，并驱逐当前 Pod 以更新至推荐值。
updateMode: "Initial" - 仅在创建 Pod 时设置资源请求，之后不做修改。
minReplicas: <number> - 最小副本数。确保在 Updater 驱逐 Pod 时，至少保持该数量的 Pod 可用。必须大于 0。

容器策略选项

containerName: "*" - 应用于 Pod 中所有容器。
mode: "Auto" - 自动为容器生成推荐。
mode: "Off" - 不为容器生成推荐。

注意：

VPA 推荐基于历史使用数据，Pod 运行数天后推荐才会准确。
在 Auto 模式应用 VPA 推荐时会触发 Pod 重建，可能导致应用短暂中断。

后续操作

配置 VPA 后，可在 弹性伸缩 区域查看目标容器的 CPU 和内存资源限制推荐值。在容器区域，选择目标容器标签页，点击 资源限制 右侧的图标，根据推荐值更新资源限制。

以 PDF 格式查看完整文档

实用指南

备份管理

恢复管理

架构

核心概念

功能指南

如何操作

ALB

故障排除

概念

功能指南

实用指南

故障排除

安装

核心概念

操作指南

实用指南

数据容灾

核心概念

操作指南

实用指南

操作指南

实用指南

合规

使用指南

API Refiner

用户

功能指南

用户组

功能指南

角色

功能指南

IDP

功能指南

故障排除

用户策略

功能指南

概览

镜像

操作指南

实用指南

虚拟机

操作指南

实用指南

问题处理

网络

操作指南

实用指南

存储

操作指南

备份和恢复

操作指南

核心概念

命名空间

创建应用

应用的操作与维护

Application Rollout

KEDA(Kubernetes Event-driven Autoscaling)

实用指南

计算组件

配置

应用可观测

实用指南

实用指南

安装

使用指南

概览

安装

升级

功能指南

How To

概念

功能指南

Argo CD 核心概念

Alauda Container Platform GitOps 核心概念

创建 GitOps 应用

GitOps 可观测

架构

操作指南

实用指南