HPA （动态扩缩容）

kubectl 有一个 scale 命令 kubectl scale deployment/nginx --replicas=4 它可以帮助 Pod 进行扩缩容，这个过程完全手动的，但是实际使用过程中，要应对线上的各种复杂情况，我们需要能够做到自动化去感知业务，来自动进行扩缩容。为此，Kubernetes 也为我们提供了这样的一个资源对象：Horizontal Pod Autoscaling（Pod 水平自动伸缩），简称 HPA，HPA 通过监控分析一些控制器控制的所有 Pod 的负载变化情况来确定是否需要调整 Pod 的副本数量，这是 HPA 最基本的原理：

我们可以简单的通过 kubectl autoscale 命令来创建一个 HPA 资源对象，HPA Controller 默认30s轮询一次（可通过 kube-controller-manager 的--horizontal-pod-autoscaler-sync-period 参数进行设置），查询指定的资源中的 Pod 资源使用率，并且与创建时设定的值和指标做对比，从而实现自动伸缩的功能。

Metrics Server

在部署 HPA 服务之前，我们需要有一个服务能够让 HPA 获取到 API 格式的指标从而达到扩缩容的目的，这个时候有一个官方推荐的项目就是 Metrics Server。HPA 是通过访问 API 格式的指标内容，如下所示：

https://10.96.0.1/apis/metrics.k8s.io/v1beta1/namespaces/<namespace-name>/pods/<pod-name>

比如当我们访问上面的 API 的时候，我们就可以获取到该 Pod 的资源数据，这些数据其实是来自于 kubelet 的 Summary API 采集而来的。不过需要说明的是我们这里可以通过标准的 API 来获取资源监控数据，并不是因为 Metrics Server 就是 APIServer 的一部分，而是通过 Kubernetes 提供的 Aggregator 汇聚插件来实现的，是独立于 APIServer 之外运行的。

安装

因为 Metrics Server 不是 API Server 自带的接口，所以使用 HPA 时需要安装一下这个服务。

我们可以通过官方网站获取这个项目的 Yaml 文件进行部署

# 官方仓库地址：https://github.com/kubernetes-sigs/metrics-server
wget https://github.com/kubernetes-sigs/metrics-server/releases/download/v0.5.1/components.yaml

在部署之前，修改 components.yaml 添加 --kubelet-insecure-tls：

args:
- --cert-dir=/tmp
- --secure-port=443
- --kubelet-insecure-tls
- --kubelet-preferred-address-types=InternalIP

等部署完成后，可以查看 Pod 日志是否正常：

[root@kube01 ~]# kubectl get pod  -n kube-system -l k8s-app=metrics-server
NAME                                     READY   STATUS    RESTARTS      AGE
metrics-server-v0.5.2-678db5756d-qjq6r   2/2     Running   2 (86d ago)   97d

现在我们可以通过 kubectl top 命令来获取到资源数据了，证明 Metrics Server 已经安装成功了。

HPA

HPA 是检测 Pod 里的 request 资源声明来判断是否需要扩缩容的情况，所以使用 HPA 一定要有 requests

apiVersion: apps/v1
kind: Deployment
metadata:
  name: hpa-demo
spec:
  selector:
    matchLabels:
      app: hpa
  template:
    metadata:
      labels:
        app: hpa
    spec:
      containers:
      - name: nginx
        image: nginx
        ports:
        - containerPort: 80
        resources:
          requests:
            memory: 50Mi
            cpu: 50m

部署完 pod 后，通过 autoscale 快捷创建动态阔缩容

[root@kube01 ~]# kubectl autoscale deployment hpa-demo --cpu-percent=10 --min=1 --max=10

[root@kube01 ~]# kubectl get hpa
NAME       REFERENCE             TARGETS   MINPODS   MAXPODS   REPLICAS   AGE
hpa-demo   Deployment/hpa-demo   0%/10%    1         10        1          8m42s

此命令创建了一个关联资源 hpa-demo 的 HPA，最小的 Pod 副本数为1，最大为10。HPA 会根据设定的 cpu 使用率（10%）动态的增加或者减少 Pod 数量。

创建一个 Pod，进行 CPU 压力测试
[root@kube01 hpa]# kubectl run -it --image busybox test-hpa --restart=Never --rm /bin/sh
/ # while true;do wget -q -O- http://172.30.1.238;done

在进行压力测试的过程中会发现 Pod 压力过大后会自动进行扩容，关掉压力测试后等 5 分钟自动进行缩容，具体扩缩容参数可以在controller-manager中进行设置

[root@kube01 ~]# kubectl get hpa -w
NAME       REFERENCE             TARGETS   MINPODS   MAXPODS   REPLICAS   AGE
hpa-demo   Deployment/hpa-demo   0%/10%    1         10        1          8m47s
hpa-demo   Deployment/hpa-demo   152%/10%   1         10        1          9m
hpa-demo   Deployment/hpa-demo   152%/10%   1         10        4          9m15s
hpa-demo   Deployment/hpa-demo   278%/10%   1         10        8          9m30s
hpa-demo   Deployment/hpa-demo   278%/10%   1         10        10         9m45s
hpa-demo   Deployment/hpa-demo   68%/10%    1         10        10         10m

菜单

HPA控制器

HPA控制器

HPA （动态扩缩容）

Metrics Server

安装

HPA

评论

调度器开发

常见问题

K6压测

athens代理go私有库

阿里云迁移腾讯云心得

PixiuHub 使用指南

简单使用 OIDC 协议实现单点登录

收集移动端日志

Linux 文件备份

Kubernetes 预留资源