一、什么是Prometheus
Prometheus 是一款开源的监控系统,于2012年由 SoundCloud 开发并在2015年正式开源。
Prometheus 最初的设计目标是为了解决在 Kubernetes 上部署的多维度、多级别的服务器群集集群监控问题。但是随着时间的推移和社区的壮大,现在它已经成为一款通用的监控系统,可以监控大规模的服务器、主机和应用程序。
Prometheus 通过 HTTP 协议从被监控目标收集指标数据,并储存在具有时间序列数据库的本地存储中。Prometheus 使用灵活的查询语言 PromQL 查询所收集的指标,并使用图表和警报规则将它们可视化并发送警报。
二、Prometheus架构详解
Prometheus 包含以下三个核心组件:
1. Prometheus server
Prometheus server 是数据收集器和实际储存数据的组件,它的主要功能是定期抓取并存储指标数据,并提供了 PromQL 查询语言接口以查询这些数据。
2. Exporters
Exporters 是一种“桥接器”,它们可以将各种数据源(如应用程序、数据库或操作系统)中的指标数据转换为 Prometheus 可以接受的格式。
3. Client libraries
Client libraries 是 Prometheus 可用的各种应用程序语言的第一方库,它们允许在应用程序中嵌入一个特定的 HTTP 请求处理程序和指标记录器,以便应用程序可以直接将指标数据发布到 Prometheus 实例。
三、Prometheus的中文意思
Prometheus 一词源于古希腊神话中的智慧神,后来被认为是人类文明的创造者和启蒙者。因此,Prometheus 被认为是“为监控而生”的一个神(Prometheus is the god for monitoring)。在人们的常规印象中,Prometheus 被认为是一种用于“剥夺”主机或应用程序内部的指标信息的工具,“盗窃”应用程序代码并以某种方式处理和存储这些数据,以便管理员可以更好地管理他们的应用程序。
四、Prometheus监控
Prometheus 监控核心时刻保持着时间序列数据库。它可以对规则定义(rules)进行计算,以便生成新的时间序列并最终使用这些时间序列生成的图形(graph)和警报(alert)。
Prometheus 能够监控的范围是非常广泛的,包括:
- 应用程序监控:HTTP 请求速率和响应时间、CPU 和内存使用情况等...
- 主机监控:CPU、内存、磁盘使用率,网络流量等...
- 容器监控:Docker、Kubernetes、云服务等...
五、Prometheus是什么神
在大规模应用程序中,需要考虑的因素比较多,如缩放,分发和负载均衡等。因此,Prometheus 设计灵活而强大,以便应对这些需求。
Prometheus 以下列方式为用户服务:
- 提供解决领域特定问题所需的功能,而同时又保持了高度可操控性。
- 提供易于使用的查询语言和可视化工具,从而使数据变得使用简单。
- 提供一个强大的查询引擎和每个指标的时间序列数据库,使用户可以轻松查询响应时间、成功率、负载均衡度等关键指标。
- 提供了一种以声明式方式定义警报的机制,该机制可以基于定制的警报来完全自动化操作。
六、Prometheus架构
Prometheus 的架构基于经典的拉模型,通过 HTTP 协议从被监控目标收集指标数据。Prometheus server 确保收集器和实际储存数据的工作,抓取并存储指标数据,并提供了 PromQL 查询语言接口让你查询你需要的数据。
七、Prometheus简介
Prometheus 是一款开源监控系统,具有通用性和扩展性,其核心设计保证了有效稳定的及时数据存储,基于 PromQL 查询语言灵活方便地查询储存的数据。同时,Prometheus 提供高效的警报机制,可以提高监控通知的质量和灵敏度。
八、Prometheus官网
更多关于 Prometheus 的信息和相关资源可以在官方网站得到: https://prometheus.io/
九、示例代码
from prometheus_client import Summary, Counter, Histogram, Gauge # 创建计时器 REQUEST_TIME = Summary('request_processing_seconds', 'Time spent processing request') # 定义装饰函数 def process_request(request): # 计算程序运行时间 start_time = time.time() # 储存程序计数器的数据 request_count.inc() try: # 程序处理代码部分 return "Hello World!" finally: # 程序结束时间 end_time = time.time() request_time.observe(end_time - start_time) # 给客户端发送指标数据 @app.route('/metrics') def metrics(): return Response(generate_latest(), mimetype='text/plain')