k8s监控怎么看

K8s监控主要通过四个方面进行：资源使用情况监控、应用性能监控、日志监控、事件监控。资源使用情况监控可以帮助了解集群和节点的资源分配和使用情况，例如CPU、内存等，从而优化资源配置，提高集群的运行效率和稳定性。

一、资源使用情况监控

资源使用情况监控是K8s监控的重要组成部分。主要通过Metrics Server、Prometheus等工具实现。Metrics Server是一个集群内的资源监控工具，能够采集集群内所有节点和Pod的资源使用情况数据。Prometheus是一款开源的监控系统，可以对K8s集群进行细粒度的监控，并提供丰富的查询语言和告警功能。

Metrics Server的使用：Metrics Server可以实时收集各个节点和Pod的CPU、内存使用情况，并通过kube-apiserver提供给用户和控制器。通过kubectl top命令可以直接查看资源使用情况，如kubectl top nodes和kubectl top pods。
Prometheus的使用：Prometheus通过拉取方式从各个K8s组件中获取指标数据。用户可以通过PromQL查询语言查询监控数据，并结合Grafana等工具可视化展示。Prometheus还支持告警功能，用户可以根据设定的规则生成告警信息。
资源监控的目的：资源使用情况监控的目的是确保集群资源的高效使用，避免资源浪费和短缺。通过监控，可以及时发现资源使用异常，例如某个Pod的内存泄漏或CPU占用过高，从而采取措施进行优化。

二、应用性能监控

应用性能监控主要关注应用在运行过程中的响应时间、错误率、吞吐量等性能指标。通过应用性能监控，可以了解应用的运行状态和性能瓶颈，及时进行优化和调整。常用的应用性能监控工具有Jaeger、Prometheus等。

Jaeger的使用：Jaeger是一个分布式追踪系统，可以帮助分析和监控微服务架构中的事务。通过Jaeger，用户可以追踪请求在各个服务中的执行情况，找到性能瓶颈和异常点。
Prometheus的使用：除了资源监控，Prometheus还可以用于应用性能监控。用户可以在应用中埋点，采集响应时间、请求数量等数据，并通过Prometheus进行查询和分析。结合Grafana，可以实现性能数据的可视化展示。
性能监控的目的：应用性能监控的目的是确保应用的高可用性和高性能。通过监控，可以及时发现应用性能问题，例如响应时间过长、错误率过高等，从而进行优化和调整，提高用户体验。

三、日志监控

日志监控是K8s监控中不可或缺的一部分。通过日志监控，可以记录应用和系统的运行状态，帮助排查问题和进行故障诊断。常用的日志监控工具有ELK Stack（Elasticsearch、Logstash、Kibana）、Fluentd等。

ELK Stack的使用：ELK Stack是一个强大的日志收集和分析平台。Logstash负责收集和处理日志数据，Elasticsearch负责存储和检索日志数据，Kibana负责可视化展示日志数据。用户可以通过Kibana的界面查询和分析日志，发现问题和异常。
Fluentd的使用：Fluentd是一个开源的数据收集器，可以将日志数据从不同来源收集、过滤并转发到指定的目标（如Elasticsearch）。Fluentd与Kubernetes结合紧密，支持多种日志格式和存储后端。
日志监控的目的：日志监控的目的是记录系统和应用的运行状态，帮助进行故障诊断和问题排查。通过监控，可以及时发现和定位问题，了解系统和应用的运行情况，确保系统的稳定性和可靠性。

四、事件监控

事件监控主要关注K8s集群中发生的各种事件，如Pod的创建、删除，节点的加入、离开等。通过事件监控，可以及时了解集群的状态变化，进行相应的处理和调整。常用的事件监控工具有Kube-state-metrics、Prometheus Alertmanager等。

Kube-state-metrics的使用：Kube-state-metrics是一个K8s的状态监控工具，可以从K8s的API Server中获取集群的状态信息，并将其暴露为Prometheus可以采集的指标。用户可以通过Prometheus查询和分析这些指标，了解集群的状态变化。
Prometheus Alertmanager的使用：Alertmanager是Prometheus的告警管理工具，可以接收Prometheus发送的告警信息，并根据预定义的规则进行告警的分组、抑制和路由。用户可以通过Alertmanager设置告警规则，及时了解集群中的事件和异常。
事件监控的目的：事件监控的目的是及时了解和处理集群中的状态变化，确保集群的稳定运行。通过监控，可以发现集群中的异常事件，例如节点宕机、Pod崩溃等，进行相应的处理和调整，保证集群的高可用性和稳定性。

综上所述，K8s监控是一个复杂而重要的任务，需要综合使用多种工具和方法，从资源使用情况、应用性能、日志和事件四个方面进行全面的监控，确保集群的稳定运行和高效使用。