在正式的生产环境中,数据库的性能和延迟对于确保系统的稳定和高效运行至关重要。特别是在与 CnosDB 数据库进行交互时,更深入地了解其表现变得尤为重要。这时Jaeger 分布式追踪系统发挥了巨大的作用。在本篇博客中,我们将深入探讨如何通过使用 Jaeger 追踪和监控 CnosDB 数据库,以便更全面地了解其性能、延迟以及潜在的问题。
了解 Jaeger 和 CnosDB
Jaeger:Jaeger 是一款强大的开源分布式追踪系统,兼容 OpenTracing API,专为监控和调试软件服务架构中的请求流程而设计。通过捕获请求在不同微服务之间的流动,Jaeger 帮助开发人员识别性能瓶颈和潜在问题。
CnosDB:CnosDB 是一款高性能的开源数据库,常用于存储和管理大量时序数据。在微服务架构中,CnosDB 通常充当数据存储和检索的后端。
在CnosDB中启用Jaeger支持
取消 [trace][https://docs.cnosdb.com/zh/latest/reference/config.html#trace]配置注释开启 Jaeger 跟踪功能。
| 提示:如需使配置生效需要重启服务。
[trace]
auto_generate_span = false
[trace.log]
path = '/tmp/cnosdb'
[trace.jaeger]
jaeger_agent_endpoint = 'http://127.0.0.1:14268/api/traces'
max_concurrent_exports = 2
max_queue_size = 4096
安装并启动Jaeger
| 其他部署方式,请参考 Jaeger Deployment[https://www.jaegertracing.io/docs/deployment/]
docker run -d --name jaeger \
-p 6831:6831/udp \
-p 6832:6832/udp \
-p 16686:16686 \
-p 14268:14268 \
jaegertracing/all-in-one:latest
成功启动后,使用浏览器访问 http://127.0.0.1:16686
跟踪CnosDB中的事件
1.在请求中添加 span context。
| 可以设置配置文件中的 auto_generate_span = true 自动生成,如果需要分析特定的语句,请在请求中自定义 uber-trace-id 值,格式如下所示(详细格式说明请参考:Propagation Format[https://www.jaegertracing.io/docs/1.46/client-libraries/#propagation-format])
uber-trace-id: 3a3a43:432e345:0:1
示例:
| 示例中的数据来源请参考:
https://docs.cnosdb.com/zh/latest/start/quick_start.html
查询数据库 oceanic_station 中 air 表中的数据,并且按时间倒序排序,返回前 5 条数据 。
curl -i -u "root:" -H "Accept: application/json" -H "uber-trace-id: 3a3a43:432e345:0:1" -XPOST "http://127.0.0.1:8902/api/v1/sql?db=oceanic_station&pretty=true" -d "select * from air order by time desc limit 5;"
使用仪表盘进行分析
1.记录 Span:
当客户端应用程序发送查询或写入请求到 CnosDB 数据库时,CnosDB 会将产生的 Span 记录发送给Jaeger 。每个 span 表示了请求的一个阶段,包括了处理时间、操作名称和其他相关信息。
2.选择 Service:
在 Jaeger 用户界面的 Service 下拉框中,选择与 CnosDB 相关的服务(例如:cnosdb_singleton_1001)。
3.查找 Traces:
在界面上,点击 "Find Traces" 按钮,系统将检索与选择的服务相关的所有 traces(追踪)。这将显示一系列的请求和对应的 spans。
4.分析 Trace 详情:
点击所感兴趣的 trace,进入详细视图。在这个视图中,你将看到整个请求的流程,以及每个 span 执行的时间。这些时间信息将帮助你了解查询的每个步骤在处理时所花费的时间。
5.优化查询和系统:
利用详细的时间记录,你可以精确地分析查询语句的性能。在正式的生产环境中,这将成为优化查询语句和改进系统性能的宝贵工具。通过分析每个 span 的执行时间,你可以找到可能导致延迟的步骤,从而采取针对性的优化措施。
除此之外,Jaeger 还可以跟踪 CnosDB 的其他事件,具体如下:
- Query 组件
- REST API
- Arrow Flight SQL API
结语
通过使用 Jaeger 来跟踪 CnosDB 数据库的性能和延迟,我们可以更全面地了解数据库的表现。通过在关键代码段中插入适当的仪器化代码,我们可以捕获请求的流动和数据库交互,轻松识别性能瓶颈,并及时解决潜在问题。集成 Jaeger 和 CnosDB,让我们能够从中获得更深入的洞察,提升整体性能和可靠性。
拓展示例
REST API请求
curl -i -u "root:" -H "Accept: application/json" -H "uber-trace-id: 3a3a43:432e345:0:1" -XPOST "http://127.0.0.1:8902/api/v1/sql?db=usage_schema&pretty=true" -d "select * from user_queries order by time desc limit 5;"
curl -i -u "root:" -H "Accept: application/json" -H "uber-trace-id: 3a3a43:432e345:0:1" -XPOST "http://127.0.0.1:8902/api/v1/sql?db=usage_schema&pretty=true" -d "CREATE TABLE air (visibility DOUBLE,temperature DOUBLE,presssure DOUBLE,TAGS(station));"
curl -i -u "root:" -H "Accept: application/json" -H "uber-trace-id: 3a3a43:432e345:0:1" -XPOST "http://127.0.0.1:8902/api/v1/write?db=public&pretty=true" -d "ma,station=XiaoMaiDao visibility=50,temperature=63,pressure=52"
使用 Prometheus 进行远程读写
remote_write:
- url: "http://127.0.0.1:8902/api/v1/prom/write?db=prometheus"
headers:
uber-trace-id: '3a3a43:432e345:0:1'
basic_auth:
username: 'root'
password: ''
remote_read cnosdb
remote_read:
- url: "http://127.0.0.1:8902/api/v1/prom/read?db=prometheus"
headers:
uber-trace-id: '3a3a43:432e345:0:1'
basic_auth:
username: 'root'
password:
使用 OpenTSDB 写入
curl -i -u "root:" -H "Accept: application/json" -H "uber-trace-id: 3a3a43:432e345:0:1" -XPOST "http://127.0.0.1:8902/api/v1/opentsdb/write?db=public" -d 'opentsdb 1689054412124000000 1 tag1=t1 field1="f1" value1=1'
curl -i -u "root:" -H "Accept: application/json" -H "uber-trace-id: 3a3a43:432e345:0:1" -XPOST "http://127.0.0.1:8902/api/v1/opentsdb/put?db=public" -d '[{"metric":"tsdbput","timestamp": 1689069407572000000,"value": 9,"tags":{"tag1":"t1","tag2":"t2"}}]'
CnosDB简介
CnosDB是一款高性能、高易用性的开源分布式时序数据库,现已正式发布及全部开源。
欢迎关注我们的社区网站:https://cn.cnosdb.com