客户端-CephFS监控埋点

275 阅读1分钟
原文链接: www.jianshu.com

1. FS Client Metrics Table

  • ceph daemon /var/run/ceph/ceph-client.admin.asok perf dump
监控类型 监控项 说明 级别
AsyncMessenger* msgr_recv_messages 网络接收消息
* msgr_send_messages 网络发送消息
* msgr_recv_bytes 网络接收字节
* msgr_send_bytes 网络发送字节
* msgr_created_connections 创建连接数
* msgr_active_connections 有效连接数
* msgr_running_total_time 线程运行的总时间
* msgr_running_send_time 消息发送的总时间
* msgr_running_recv_time 消息接收的总时间
* msgr_running_fast_dispatch_time 快速调度总时间

2. FS Client Metrics Table

监控类型 监控项 说明 级别
client reply.avgcount 在元数据请求上接收答复的等待时间队列的平均数
* reply.sum 在元数据请求上接收答复的等待时间队列的总数
* reply.avgtime 在元数据请求上接收答复的等待时间队列的平均时间
* lat.avgcount 处理元数据请求的等待时间队列的平均数
* lat.sum 处理元数据请求的等待时间队列的总数
* lat.avgtime 处理元数据请求的等待时间队列的平均时间
* wrlat.avgcount 文件数据写入操作的等待时间队列的平均数
* wrlat.sum 文件数据写入操作的等待时间队列的总数
* wrlat.avgtime 文件数据写入操作的等待时间队列的平均时间

3. FS ObjectCacher-libcephfs Metrics Table

监控类型 监控项 说明 级别
objectcacher-libcephfs cache_ops_hit 命中缓存
* cache_ops_miss 穿透缓存
* cache_bytes_hit 命中缓存大小
* cache_bytes_miss 穿透缓存大小
* data_read 读数据大小
* data_written 写缓存数据大小
* data_flushed 数据刷新
* data_overwritten_while_flushing 刷新时数据重写
* write_ops_blocked 肮脏限制延迟的写操作
* write_bytes_blocked 写入脏数据的限制
* write_time_blocked 由于脏数据限制而阻塞写入的时间