您的位置:

Prometheus中文手册详解

一、什么是Prometheus

Prometheus 是一款开源的监控系统,于2012年由 SoundCloud 开发并在2015年正式开源。

Prometheus 最初的设计目标是为了解决在 Kubernetes 上部署的多维度、多级别的服务器群集集群监控问题。但是随着时间的推移和社区的壮大,现在它已经成为一款通用的监控系统,可以监控大规模的服务器、主机和应用程序。

Prometheus 通过 HTTP 协议从被监控目标收集指标数据,并储存在具有时间序列数据库的本地存储中。Prometheus 使用灵活的查询语言 PromQL 查询所收集的指标,并使用图表和警报规则将它们可视化并发送警报。

二、Prometheus架构详解

Prometheus 包含以下三个核心组件:

1. Prometheus server

Prometheus server 是数据收集器和实际储存数据的组件,它的主要功能是定期抓取并存储指标数据,并提供了 PromQL 查询语言接口以查询这些数据。

2. Exporters

Exporters 是一种“桥接器”,它们可以将各种数据源(如应用程序、数据库或操作系统)中的指标数据转换为 Prometheus 可以接受的格式。

3. Client libraries

Client libraries 是 Prometheus 可用的各种应用程序语言的第一方库,它们允许在应用程序中嵌入一个特定的 HTTP 请求处理程序和指标记录器,以便应用程序可以直接将指标数据发布到 Prometheus 实例。

三、Prometheus的中文意思

Prometheus 一词源于古希腊神话中的智慧神,后来被认为是人类文明的创造者和启蒙者。因此,Prometheus 被认为是“为监控而生”的一个神(Prometheus is the god for monitoring)。在人们的常规印象中,Prometheus 被认为是一种用于“剥夺”主机或应用程序内部的指标信息的工具,“盗窃”应用程序代码并以某种方式处理和存储这些数据,以便管理员可以更好地管理他们的应用程序。

四、Prometheus监控

Prometheus 监控核心时刻保持着时间序列数据库。它可以对规则定义(rules)进行计算,以便生成新的时间序列并最终使用这些时间序列生成的图形(graph)和警报(alert)。

Prometheus 能够监控的范围是非常广泛的,包括:

  • 应用程序监控:HTTP 请求速率和响应时间、CPU 和内存使用情况等...
  • 主机监控:CPU、内存、磁盘使用率,网络流量等...
  • 容器监控:Docker、Kubernetes、云服务等...

五、Prometheus是什么神

在大规模应用程序中,需要考虑的因素比较多,如缩放,分发和负载均衡等。因此,Prometheus 设计灵活而强大,以便应对这些需求。

Prometheus 以下列方式为用户服务:

  • 提供解决领域特定问题所需的功能,而同时又保持了高度可操控性。
  • 提供易于使用的查询语言和可视化工具,从而使数据变得使用简单。
  • 提供一个强大的查询引擎和每个指标的时间序列数据库,使用户可以轻松查询响应时间、成功率、负载均衡度等关键指标。
  • 提供了一种以声明式方式定义警报的机制,该机制可以基于定制的警报来完全自动化操作。

六、Prometheus架构

Prometheus 的架构基于经典的拉模型,通过 HTTP 协议从被监控目标收集指标数据。Prometheus server 确保收集器和实际储存数据的工作,抓取并存储指标数据,并提供了 PromQL 查询语言接口让你查询你需要的数据。

七、Prometheus简介

Prometheus 是一款开源监控系统,具有通用性和扩展性,其核心设计保证了有效稳定的及时数据存储,基于 PromQL 查询语言灵活方便地查询储存的数据。同时,Prometheus 提供高效的警报机制,可以提高监控通知的质量和灵敏度。

八、Prometheus官网

更多关于 Prometheus 的信息和相关资源可以在官方网站得到: https://prometheus.io/

九、示例代码

from prometheus_client import Summary, Counter, Histogram, Gauge

# 创建计时器
REQUEST_TIME = Summary('request_processing_seconds',
                       'Time spent processing request')

# 定义装饰函数
def process_request(request):
  # 计算程序运行时间
  start_time = time.time()
  # 储存程序计数器的数据
  request_count.inc()
  try:
      # 程序处理代码部分
      return "Hello World!"
  finally:
      # 程序结束时间
      end_time = time.time()
      request_time.observe(end_time - start_time)

# 给客户端发送指标数据
@app.route('/metrics')
def metrics():
  return Response(generate_latest(), mimetype='text/plain')