资源指标

从宿主机到控制面和节点都需要
 
控制面组件包括 API Server、Scheduler、Controller-Manager、ETCD 四个组件,每个组件都很重要,需要黑盒、白盒监控并举。工作负载节点运行了 Pod 容器负载,以及容器引擎和 Kubernetes Node 组件,容器引擎图上是 Docker,不过不局限 Docker,也可能是别的容器引擎,Kubernetes Node 组件包括 Kubelet 和 Kube-Proxy,也都是需要监控的。
notion image

k8s资源对象指标

kube-state-metrics

cAdvisor主要是底层容器运行时的性能指标,并没有kubernetes集群资源对象的状态指标,比如我们想了解服务运行状态、Pod有没有重启、伸缩有没有成功、Pod的状态是怎么样的等,kubernetes提供了一个kube-state-metrics组件可以用来暴露这些指标。
kube-state-metrics 只是一个简单的服务,该服务通过监听API Server订阅各类资源对象的变更生成有关资源对象的最新状态指标,比如DeploymentDaemonsetStatefulSetNodePodContainerService等。它不关注 Kubernetes 节点组件的运行状况,而是关注集群内部各种资源对象的运行状况,需要注意的是kube-state-metrics只是简单的提供一个metrics数据,并不会存储这些指标数据,所以我们可以使用prometheus来抓取这些数据然后存储。
cAdvisor 已经被 Kubernetes 默认集成,而kube-state-metrics并没有被默认集成,所以我们要想监控集群完整数据,就需要在 kubernetes 中单独部署kube-state-metrics组件,这样才能够将集群中的服务资源指标数据暴露出来,以便于对不同资源进行监控。
kube-state-metrics组件部署比较简单,不过需要注意版本兼容的问题:
notion image
我的kubernetes版本是v1.21.0,所以这里选择kube-state-metrics版本v2.3.0

部署

1、在master节点上创建目录kube-state-metrics,并将kube-state-metrics-2.3.0.tar.gz解压包中examples/standard目录下文件拷贝到kube-state-metrics目录中:
由于 kube-state-metrics 组件需要通过与 kube-apiserver 连接,并调用相应的接口去获取 kubernetes 集群数据,这个过程需要kube-state-metrics组件拥有一定的权限才能成功执行这些操作。在 kubernetes 中默认使用 RBAC 方式管理权限,所以,我们需要创建相应的 RBAC 资源来提供该组件使用。
2、修改镜像:
k8s.gcr.io/kube-state-metrics/kube-state-metrics:v2.3.0这个镜像是特别注意的,因为前缀是k8s.gcr.io,所以是pull不了的需要,改为registry.cn-beijing.aliyuncs.com/zhaohongye/kube-state-metrics:v2.3.0
3、创建部署:
4、查看是否允许成功:
5、验证/metrics端点是否可以采集指标:
访问kube-state-metrics组件的pod ip+8080端口。

prometheus接入

/metrics端点可以采集到指标数据,说明kube-state-metrics组件部署正常,下面就可以使用prometheus接入。
1、该组件创建了svc名称kube-state-metrics,所以可以采用serviceendpoints服务发现协议,配置如下:
参见prometheus部署一节,prometheus的配置放到prometheus-config这个ConfigMap中。并将configmap-reload容器以sidecar模式部署到prometheus容器部署到一起,我们只需要修改prometheus-config这个ConfigMapconfigmap-reload容器会自动监听变更,然后拉取最新的配置并热更新到prometheus
2、查看prometheus的web页面下target信息,接入正常:
notion image
3、grafana中导入14518 dashboardkube-state-metrics性能监控指标就展示到模板上。
a、如集群Node节点性能指标,如CPU、内存、网络IO、磁盘IO、磁盘等监控信息:
notion image
b、如集群中各种资源对象统计,比如各种状态Pod数量统计、namespace数量、pvc数量、node节点上运行pod统计,namespace资源申请统计等等。
notion image
c、更多资源监控如下:
notion image

metrics-server

kube-state-metrics组件经常容易混淆的还有一个组件metrics-server,下面来看下该组件的作用。
kubernetes 1.8开始,资源使用指标,如容器的CPU和内存,是通过Metrics APIkubernetes中获取,这些数据可以由用户直接访问,例如通过使用kubectl top命令查看节点、Pod或容器的CPU和内存使用信息, 或者由集群中的控制器,例如VPAHPA等使用来进行决策,metrics-server组件替代了heapster实现了这套接口,heapster从1.11开始逐渐被废弃。
VPAHPA读书用于扩缩容技术,扩缩容判断的标准是否出现性能问题,metrics-server就是为性能问题提供数据依据。
metrics-server是集群核心监控数据的聚合器,通俗地说,它存储了集群中各节点的监控数据,并且提供了API以供分析和使用。核心原理就是从每个节点上的 kubelet组件Summary API采集指标信息,如下指令就可以获取到k8s-02节点上kubelet组件的summart数据:
这里数据就是节点的CPU、内存、网络、文件系统的使用情况,以及更细化的该节点上每个容器的CPU、内存、网络、volume等使用情况,metrics-server组件通过kubelet组件将集群中所有节点的信息都收集汇集到一起,这样在控制台输入kubectl top pods 命令就可以查看到这些信息。
比如查看每个节点的CPU和内存使用情况:
或者查看Pod的CPU和内存使用情况:
还可以更细化查看pod里容器的负载:
这个功能的背后就是metric-server这个组件提供的支持,如果没有部署这个组件,执行kubectl top指令会报错。
metrics-server关注的是底层容器CPU、内存等性能数据,其来源于kubelet组件,其实来源于kubelet内部集成的cAdvisor组件提供的容器性能指标,即cAdvisor提供的性能指标已经包含metrics-server组件的性能指标,prometheus采集是只需要采集cAdvisor组件,metrics-server不在需要接入prometheus监控。」

部署

1、metrics-server 是扩展的依赖于kube-aggregator,因为我们需要在 APIServer 中添加启动参数--enable-aggregator-routing=true
如果您未在master节点上运行kube-proxy,则必须确保 kube-apiserver启动参数中包含--enable-aggregator-routing=true
然后,重启kubelet组件:systemctl restart kubelet
2、下载metrics-server介质:https://github.com/kubernetes-sigs/metrics-server/releases
notion image
我这里下载v0.6.1版本。
3、修改配置:
notion image
注意事项:
1、如果需要忽略 Kubelet certificate ,name只需要在 deployment 的containers.args 中加上 –kubelet-insecure-tls 即可 2、如果在国内,需要将镜像仓库更改为国内的源,例如阿里云的,例如将 k8s.gcr.io/metrics-server/metrics-server 更改为 registry.aliyuncs.com/google_containers/metrics-server。
3、添加配置hostNetwork: true
4、创建部署:
5、查看是否运行成功:
隔个一两分钟就可以看到metrics-server-5bb7df9c68-x4ttq运行成功。
6、执行kubectl top指令验证是否正常:
「所以,总结下:kube-state-metricsmetrics-server之间还是有很大不同的,kube-state-metrics主要关注的是业务相关的一些元数据,比如Deployment、Pod、副本状态等;metrics-service主要关注的是资源度量API的实现,比如CPU、内存、网络等指标,为kubectl top指令查看性能信息,或为VPA、HPA等组件提供决策指标支持。」
Loading...
目录
文章列表
王小扬博客
产品
Think
Git
软件开发
计算机网络
CI
DB
设计
缓存
Docker
Node
操作系统
Java
大前端
Nestjs
其他
PHP