k8s如何查看容器内存资源

Kubernetes（k8s）可以通过多种方法查看容器内存资源，例如使用kubectl命令、通过Metrics Server、使用Prometheus和Grafana、通过Kubernetes Dashboard。这些方法各有优缺点，但其中使用kubectl命令是最简单和直接的方式。你只需运行几条简单的命令即可查看容器的内存使用情况，并且不需要额外的配置或工具。例如，使用kubectl top pod命令可以实时查看所有Pod的内存使用情况，这对于日常监控和管理非常有用。

一、KUBECTL命令

使用kubectl命令是查看Kubernetes中容器内存资源的最直接方式。首先，你需要确保集群中已经安装了Metrics Server。安装Metrics Server后，可以使用以下命令查看内存使用情况：

kubectl top pod

这条命令会显示所有Pod的CPU和内存使用情况。为了查看特定命名空间的Pod资源使用情况，可以使用：

kubectl top pod -n <namespace>

如果你想查看特定Pod的详细资源使用情况，可以使用：

kubectl describe pod <pod-name> -n <namespace>

这条命令会显示Pod的详细信息，包括内存使用情况。通过这些命令，你可以快速了解集群中各个容器的内存使用情况。

二、METRICS SERVER

Metrics Server是Kubernetes官方提供的一个轻量级的资源度量工具。它可以收集集群中各个节点和Pod的实时资源使用情况，包括CPU和内存。安装Metrics Server后，可以使用kubectl top命令查看资源使用情况。以下是安装Metrics Server的步骤：

下载Metrics Server的部署文件：

git clone https://github.com/kubernetes-sigs/metrics-server.git

部署Metrics Server：

kubectl apply -f metrics-server/deploy/1.8+/

验证Metrics Server是否正常运行：

kubectl get deployment metrics-server -n kube-system

安装完成后，可以使用kubectl top命令查看实时的资源使用情况。Metrics Server的优势在于它是轻量级的，不会对集群性能造成太大影响。

三、PROMETHEUS和GRAFANA

Prometheus和Grafana是用于监控和可视化Kubernetes集群资源使用情况的强大工具。Prometheus负责数据采集和存储，而Grafana用于数据的可视化展示。使用这两个工具可以实现更复杂和精细的监控。

安装Prometheus和Grafana：

可以通过Helm Chart快速安装Prometheus和Grafana：

helm install stable/prometheus --name prometheus helm install stable/grafana --name grafana

配置Prometheus收集Kubernetes指标：

Prometheus需要配置Scrape目标，以收集Kubernetes节点、Pod等的资源使用情况。可以在Prometheus的配置文件prometheus.yml中添加以下内容：

scrape_configs: - job_name: 'kubernetes' kubernetes_sd_configs: - role: node - role: pod

在Grafana中添加Prometheus数据源：

打开Grafana的Web UI，添加Prometheus作为数据源，并创建相应的Dashboard以可视化Kubernetes的资源使用情况。

通过Prometheus和Grafana，你可以获得更详细的历史数据和趋势分析，帮助你更好地了解和优化集群资源使用情况。

四、KUBERNETES DASHBOARD

Kubernetes Dashboard是一个基于Web的用户界面，提供了对Kubernetes集群的管理和监控功能。通过Dashboard，你可以直观地查看各个Pod的资源使用情况，包括内存和CPU。安装和使用Kubernetes Dashboard的步骤如下：

安装Kubernetes Dashboard：

kubectl apply -f https://raw.githubusercontent.com/kubernetes/dashboard/v2.2.0/aio/deploy/recommended.yaml

创建管理员用户和绑定角色：

apiVersion: v1 kind: ServiceAccount metadata: name: admin-user namespace: kubernetes-dashboard --- apiVersion: rbac.authorization.k8s.io/v1 kind: ClusterRoleBinding metadata: name: admin-user roleRef: apiGroup: rbac.authorization.k8s.io kind: ClusterRole name: cluster-admin subjects: - kind: ServiceAccount name: admin-user namespace: kubernetes-dashboard

kubectl apply -f admin-user.yaml

获取登录令牌：

kubectl -n kubernetes-dashboard create token admin-user

访问Dashboard：

通过以下命令启用代理并访问Dashboard：

kubectl proxy

然后在浏览器中访问http://localhost:8001/api/v1/namespaces/kubernetes-dashboard/services/https:kubernetes-dashboard:/proxy/，使用获取的令牌登录。

通过Kubernetes Dashboard，你可以轻松地查看和管理集群资源，进行故障排查和性能优化。

五、KUBE-STATE-METRICS

Kube-state-metrics是一个Kubernetes组件，专门用于生成关于Kubernetes集群状态的指标。它会生成关于Pod、Node、Namespace等资源的详细状态信息，这些信息可以被Prometheus等监控系统收集和展示。安装Kube-state-metrics的步骤如下：

安装Kube-state-metrics：

kubectl apply -f https://github.com/kubernetes/kube-state-metrics/blob/master/examples/standard/deployment.yaml

配置Prometheus收集Kube-state-metrics的指标：

在Prometheus的配置文件prometheus.yml中添加以下内容：

scrape_configs:
  - job_name: 'kube-state-metrics'
    static_configs:
    - targets: ['<kube-state-metrics-service>:8080']

创建Grafana Dashboard以展示Kube-state-metrics指标：

在Grafana中创建一个新的Dashboard，添加Prometheus数据源，并使用Kube-state-metrics提供的指标创建图表。

通过Kube-state-metrics，你可以获得更详细和丰富的集群状态信息，帮助你进行更全面的监控和分析。

六、NODE EXPORTER

Node Exporter是一个用于收集Kubernetes节点操作系统级别指标的工具。它可以收集节点的CPU、内存、磁盘等资源使用情况，并将这些数据发送到Prometheus进行存储和分析。安装和配置Node Exporter的步骤如下：

安装Node Exporter：

kubectl apply -f https://github.com/prometheus/node_exporter/blob/master/examples/node-exporter-daemonset.yaml

配置Prometheus收集Node Exporter的指标：

在Prometheus的配置文件prometheus.yml中添加以下内容：

scrape_configs: - job_name: 'node-exporter' kubernetes_sd_configs: - role: node relabel_configs: - action: labelmap regex: __meta_kubernetes_node_label_(.+) - target_label: __address__ replacement: kubernetes.default.svc:9100 - source_labels: [__meta_kubernetes_node_name] target_label: instance

创建Grafana Dashboard以展示Node Exporter指标：

在Grafana中创建一个新的Dashboard，添加Prometheus数据源，并使用Node Exporter提供的指标创建图表。

通过Node Exporter，你可以获得详细的节点级别资源使用情况，帮助你进行更深入的性能分析和优化。

七、CLOUD PROVIDER MONITORING TOOLS

许多云提供商（如AWS、GCP、Azure）都提供了自家的Kubernetes监控工具。这些工具通常与云平台的其他服务紧密集成，提供了更全面的监控和管理功能。以下是一些常见云提供商的Kubernetes监控工具：

AWS CloudWatch：

AWS CloudWatch可以监控EKS（Elastic Kubernetes Service）集群的资源使用情况。你可以配置CloudWatch收集EKS集群的指标，并在CloudWatch Dashboard中进行可视化展示。此外，CloudWatch还提供了告警功能，可以在资源使用超过阈值时发送通知。
GCP Stackdriver：

GCP Stackdriver可以监控GKE（Google Kubernetes Engine）集群的资源使用情况。你可以配置Stackdriver收集GKE集群的指标，并在Stackdriver Dashboard中进行可视化展示。Stackdriver还提供了日志分析和告警功能，帮助你更好地管理和优化集群资源。
Azure Monitor：

Azure Monitor可以监控AKS（Azure Kubernetes Service）集群的资源使用情况。你可以配置Azure Monitor收集AKS集群的指标，并在Azure Monitor Dashboard中进行可视化展示。Azure Monitor还提供了日志分析和告警功能，帮助你更好地管理和优化集群资源。

这些云提供商提供的监控工具通常易于配置和使用，适合在特定云平台上运行的Kubernetes集群。

八、LOGGING和MONITORING OPERATORS

Logging和Monitoring Operators是Kubernetes中的一种特殊类型的控制器，用于简化集群的日志和监控管理。这些Operators可以自动化地部署和配置监控和日志工具，使得集群的管理更加高效和便捷。

Elasticsearch Operator：

Elasticsearch Operator可以自动化地部署和管理Elasticsearch集群，用于收集和存储日志数据。你可以通过Elasticsearch Operator快速部署一个高可用的Elasticsearch集群，并配置Kibana进行日志分析和可视化展示。
Prometheus Operator：

Prometheus Operator可以自动化地部署和管理Prometheus监控系统。你可以通过Prometheus Operator快速部署一个高可用的Prometheus集群，并配置Alertmanager进行告警管理。Prometheus Operator还提供了ServiceMonitor和PodMonitor CRD，用于灵活地配置和管理监控目标。
Fluentd Operator：

Fluentd Operator可以自动化地部署和管理Fluentd日志收集器。你可以通过Fluentd Operator快速部署一个高可用的Fluentd集群，并配置输出插件将日志数据发送到Elasticsearch、Prometheus等目标。

通过使用Logging和Monitoring Operators，你可以大大简化集群的日志和监控管理，提高管理效率和可靠性。

九、CUSTOM METRICS API

Custom Metrics API是Kubernetes的一项扩展功能，允许你定义和使用自定义指标。这些自定义指标可以用于自动扩展（Horizontal Pod Autoscaler，HPA）和告警管理。通过Custom Metrics API，你可以监控和管理应用程序特定的指标，如请求速率、错误率等。

安装Custom Metrics API：

Custom Metrics API通常与Metrics Server或Prometheus Adapter一起使用。你可以通过以下命令安装Prometheus Adapter：

kubectl apply -f https://github.com/DirectXMan12/k8s-prometheus-adapter/blob/master/deploy/manifests/custom-metrics-apiserver-deployment.yaml

定义和使用自定义指标：

你可以通过Prometheus Adapter将Prometheus中的指标暴露为Kubernetes的自定义指标。以下是一个示例配置：

apiVersion: v1
kind: ConfigMap
metadata:
  name: adapter-config
  namespace: custom-metrics
data:
  config.yaml: |
    rules:
    - seriesQuery: 'http_requests_total'
      resources:
        overrides:
          namespace:
            resource: namespace
          pod:
            resource: pod
      name:
        matches: "^(.*)_total"
        as: "${1}_per_second"
      metricsQuery: 'rate(<<.Series>>{<<.LabelMatchers>>}[1m])'

使用自定义指标进行自动扩展：

你可以在HPA中使用自定义指标实现自动扩展。以下是一个示例HPA配置：

apiVersion: autoscaling/v2beta2 kind: HorizontalPodAutoscaler metadata: name: my-app spec: scaleTargetRef: apiVersion: apps/v1 kind: Deployment name: my-app minReplicas: 1 maxReplicas: 10 metrics: - type: Pods pods: metric: name: http_requests_per_second target: type: AverageValue averageValue: 100

通过Custom Metrics API，你可以实现更灵活和精细的监控和自动扩展，提升应用程序的可用性和性能。

十、CONCLUSION

Kubernetes提供了多种方法查看和监控容器内存资源。使用kubectl命令、Metrics Server、Prometheus和Grafana、Kubernetes Dashboard等工具，你可以实时查看集群中各个容器的内存使用情况，进行趋势分析和性能优化。此外，云提供商提供的监控工具、Logging和Monitoring Operators、Custom Metrics API等扩展功能，进一步提升了集群的管理和监控能力。通过合理使用这些工具和方法，你可以全面了解和优化Kubernetes集群的资源使用情况，确保应用程序的高可用性和性能。