HPA控制器

Administrator
发布于 2023-12-05 / 51 阅读 / 0 评论 / 0 点赞

HPA控制器

HPA (动态扩缩容)

kubectl 有一个 scale 命令 kubectl scale deployment/nginx --replicas=4 它可以帮助 Pod 进行扩缩容,这个过程完全手动的,但是实际使用过程中,要应对线上的各种复杂情况,我们需要能够做到自动化去感知业务,来自动进行扩缩容。为此,Kubernetes 也为我们提供了这样的一个资源对象:Horizontal Pod Autoscaling(Pod 水平自动伸缩),简称 HPA,HPA 通过监控分析一些控制器控制的所有 Pod 的负载变化情况来确定是否需要调整 Pod 的副本数量,这是 HPA 最基本的原理:

image-xole.png

我们可以简单的通过 kubectl autoscale 命令来创建一个 HPA 资源对象,HPA Controller 默认30s轮询一次(可通过 kube-controller-manager 的--horizontal-pod-autoscaler-sync-period 参数进行设置),查询指定的资源中的 Pod 资源使用率,并且与创建时设定的值和指标做对比,从而实现自动伸缩的功能。

Metrics Server

在部署 HPA 服务之前,我们需要有一个服务能够让 HPA 获取到 API 格式的指标从而达到扩缩容的目的,这个时候有一个官方推荐的项目就是 Metrics Server。HPA 是通过访问 API 格式的指标内容,如下所示:

https://10.96.0.1/apis/metrics.k8s.io/v1beta1/namespaces/<namespace-name>/pods/<pod-name>

比如当我们访问上面的 API 的时候,我们就可以获取到该 Pod 的资源数据,这些数据其实是来自于 kubelet 的 Summary API 采集而来的。不过需要说明的是我们这里可以通过标准的 API 来获取资源监控数据,并不是因为 Metrics Server 就是 APIServer 的一部分,而是通过 Kubernetes 提供的 Aggregator 汇聚插件来实现的,是独立于 APIServer 之外运行的。

image-ylvq.png

安装

因为 Metrics Server 不是 API Server 自带的接口,所以使用 HPA 时需要安装一下这个服务。

我们可以通过官方网站获取这个项目的 Yaml 文件进行部署

# 官方仓库地址:https://github.com/kubernetes-sigs/metrics-server
wget https://github.com/kubernetes-sigs/metrics-server/releases/download/v0.5.1/components.yaml

在部署之前,修改 components.yaml 添加 --kubelet-insecure-tls:

args:
- --cert-dir=/tmp
- --secure-port=443
- --kubelet-insecure-tls
- --kubelet-preferred-address-types=InternalIP

等部署完成后,可以查看 Pod 日志是否正常:

[root@kube01 ~]# kubectl get pod  -n kube-system -l k8s-app=metrics-server
NAME                                     READY   STATUS    RESTARTS      AGE
metrics-server-v0.5.2-678db5756d-qjq6r   2/2     Running   2 (86d ago)   97d

现在我们可以通过 kubectl top 命令来获取到资源数据了,证明 Metrics Server 已经安装成功了。

HPA

HPA 是检测 Pod 里的 request 资源声明来判断是否需要扩缩容的情况,所以使用 HPA 一定要有 requests

apiVersion: apps/v1
kind: Deployment
metadata:
  name: hpa-demo
spec:
  selector:
    matchLabels:
      app: hpa
  template:
    metadata:
      labels:
        app: hpa
    spec:
      containers:
      - name: nginx
        image: nginx
        ports:
        - containerPort: 80
        resources:
          requests:
            memory: 50Mi
            cpu: 50m

部署完 pod 后,通过 autoscale 快捷创建动态阔缩容

[root@kube01 ~]# kubectl autoscale deployment hpa-demo --cpu-percent=10 --min=1 --max=10

[root@kube01 ~]# kubectl get hpa
NAME       REFERENCE             TARGETS   MINPODS   MAXPODS   REPLICAS   AGE
hpa-demo   Deployment/hpa-demo   0%/10%    1         10        1          8m42s

此命令创建了一个关联资源 hpa-demo 的 HPA,最小的 Pod 副本数为1,最大为10。HPA 会根据设定的 cpu 使用率(10%)动态的增加或者减少 Pod 数量。

创建一个 Pod,进行 CPU 压力测试
[root@kube01 hpa]# kubectl run -it --image busybox test-hpa --restart=Never --rm /bin/sh
/ # while true;do wget -q -O- http://172.30.1.238;done

在进行压力测试的过程中会发现 Pod 压力过大后会自动进行扩容,关掉压力测试后等 5 分钟自动进行缩容,具体扩缩容参数可以在controller-manager中进行设置

[root@kube01 ~]# kubectl get hpa -w
NAME       REFERENCE             TARGETS   MINPODS   MAXPODS   REPLICAS   AGE
hpa-demo   Deployment/hpa-demo   0%/10%    1         10        1          8m47s
hpa-demo   Deployment/hpa-demo   152%/10%   1         10        1          9m
hpa-demo   Deployment/hpa-demo   152%/10%   1         10        4          9m15s
hpa-demo   Deployment/hpa-demo   278%/10%   1         10        8          9m30s
hpa-demo   Deployment/hpa-demo   278%/10%   1         10        10         9m45s
hpa-demo   Deployment/hpa-demo   68%/10%    1         10        10         10m