K8S学习之基础三十五：k8s之Prometheus部署模式

news2026/2/14 16:38:03

Prometheus 有多种部署模式，适用于不同的场景和需求。以下是几种常见的部署模式：

1. 单节点部署

这是最简单的部署模式，适用于小型环境或测试环境。

特点：

单个 Prometheus 实例负责所有的数据采集、存储和查询。
配置简单，易于维护。
不具备高可用性和扩展性。

适用场景：

小型项目或测试环境。
对高可用性要求不高的场景。

部署步骤：

下载并解压 Prometheus。
配置 prometheus.yml。
启动 Prometheus。

bash

复制

./prometheus --config.file=prometheus.yml

2. 高可用部署（HA）

为了提高系统的可用性和容错能力，可以使用高可用部署模式。

特点：

多个 Prometheus 实例同时运行，采集相同的数据。
通过负载均衡器分发查询请求。
具备高可用性，单个实例故障不会影响整体服务。

适用场景：

对高可用性要求较高的生产环境。
需要确保监控系统持续可用的场景。

部署步骤：

部署多个 Prometheus 实例，配置相同的 prometheus.yml。
使用负载均衡器（如 Nginx、HAProxy）分发查询请求。
配置 Alertmanager 处理告警。

yaml

复制

# prometheus.yml 示例
global:
  scrape_interval: 15s

scrape_configs:
  - job_name: 'prometheus'
    static_configs:
      - targets: ['localhost:9090']

3. 联邦部署（Federation）

联邦部署模式适用于大规模分布式系统，通过分层采集和汇总数据。

特点：

多个 Prometheus 实例分别采集不同区域或服务的数据。
一个中心 Prometheus 实例从其他实例中采集汇总数据。
适用于大规模、分布式环境。

适用场景：

大规模分布式系统。
需要分区域或分服务采集数据的场景。

部署步骤：

部署多个 Prometheus 实例，分别采集不同区域或服务的数据。
配置中心 Prometheus 实例，从其他实例中采集汇总数据。

yaml

复制

# 中心 Prometheus 配置示例
scrape_configs:
  - job_name: 'federate'
    scrape_interval: 15s
    honor_labels: true
    metrics_path: '/federate'
    params:
      'match[]':
        - '{job="prometheus"}'
        - '{__name__=~"job:.*"}'
    static_configs:
      - targets:
        - 'source-prometheus-1:9090'
        - 'source-prometheus-2:9090'

4. 分片部署（Sharding）

分片部署模式通过将数据采集任务分散到多个 Prometheus 实例，适用于超大规模环境。

特点：

多个 Prometheus 实例分别负责不同的数据采集任务。
通过分片策略（如哈希分片）分配采集任务。
适用于超大规模、高并发的环境。

适用场景：

超大规模系统，单个 Prometheus 实例无法处理所有数据。
需要高并发采集和存储的场景。

部署步骤：

部署多个 Prometheus 实例，配置不同的 prometheus.yml。
使用分片策略（如哈希分片）分配采集任务。
配置中心 Prometheus 实例或查询层（如 Thanos）汇总数据。

yaml

复制

# 分片 Prometheus 配置示例
global:
  scrape_interval: 15s

scrape_configs:
  - job_name: 'sharded_job'
    static_configs:
      - targets: ['target1:9100', 'target2:9100']
    relabel_configs:
      - source_labels: [__address__]
        modulus: 2
        target_label: __tmp_hash
        action: hashmod
      - source_labels: [__tmp_hash]
        regex: '0'
        action: keep

5. 使用 Thanos 或 Cortex 的分布式部署

Thanos 和 Cortex 是 Prometheus 的扩展项目，提供了分布式存储和查询能力。

特点：

提供全局视图和长期存储能力。
支持高可用性和水平扩展。
适用于大规模、长期存储和查询的场景。

适用场景：

需要长期存储监控数据的场景。
需要全局视图和高可用性的场景。

部署步骤：

部署多个 Prometheus 实例，配置相同的 prometheus.yml。
部署 Thanos 或 Cortex 组件（如 Sidecar、Store Gateway、Querier 等）。
配置 Thanos 或 Cortex 的全局视图和长期存储。

yaml

复制

# Thanos Sidecar 配置示例
apiVersion: apps/v1
kind: Deployment
metadata:
  name: prometheus
spec:
  replicas: 1
  template:
    spec:
      containers:
      - name: prometheus
        image: prom/prometheus:latest
        args:
          - "--config.file=/etc/prometheus/prometheus.yml"
          - "--storage.tsdb.path=/prometheus"
          - "--web.enable-lifecycle"
      - name: thanos-sidecar
        image: thanosio/thanos:latest
        args:
          - "sidecar"
          - "--prometheus.url=http://localhost:9090"
          - "--tsdb.path=/prometheus"

6. 使用 Operator 部署

Prometheus Operator 是 Kubernetes 上的一个扩展，简化了 Prometheus 的部署和管理。

特点：

自动化部署和管理 Prometheus 实例。
提供自定义资源定义（CRD）来配置 Prometheus。
适用于 Kubernetes 环境。

适用场景：

Kubernetes 环境。
需要自动化部署和管理的场景。

部署步骤：

安装 Prometheus Operator。
使用自定义资源定义（CRD）配置 Prometheus 实例。

bash

复制

# 安装 Prometheus Operator
kubectl apply -f https://raw.githubusercontent.com/prometheus-operator/prometheus-operator/main/bundle.yaml

# 创建 Prometheus 实例
apiVersion: monitoring.coreos.com/v1
kind: Prometheus
metadata:
  name: prometheus
spec:
  serviceAccountName: prometheus
  serviceMonitorSelector:
    matchLabels:
      team: frontend
  resources:
    requests:
      memory: 400Mi

总结

不同的部署模式适用于不同的场景和需求。单节点部署适合小型环境，高可用部署适合生产环境，联邦部署和分片部署适合大规模分布式系统，而使用 Thanos 或 Cortex 的分布式部署适合需要长期存储和全局视图的场景。在 Kubernetes 环境中，使用 Prometheus Operator 可以简化部署和管理。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2317470.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！