1. FS Client Metrics Table
- ceph daemon /var/run/ceph/ceph-client.admin.asok perf dump
| 监控类型 | 监控项 | 说明 | 级别 |
|---|---|---|---|
| AsyncMessenger* | msgr_recv_messages | 网络接收消息 | |
| * | msgr_send_messages | 网络发送消息 | |
| * | msgr_recv_bytes | 网络接收字节 | |
| * | msgr_send_bytes | 网络发送字节 | |
| * | msgr_created_connections | 创建连接数 | |
| * | msgr_active_connections | 有效连接数 | |
| * | msgr_running_total_time | 线程运行的总时间 | |
| * | msgr_running_send_time | 消息发送的总时间 | |
| * | msgr_running_recv_time | 消息接收的总时间 | |
| * | msgr_running_fast_dispatch_time | 快速调度总时间 |
2. FS Client Metrics Table
| 监控类型 | 监控项 | 说明 | 级别 |
|---|---|---|---|
| client | reply.avgcount | 在元数据请求上接收答复的等待时间队列的平均数 | |
| * | reply.sum | 在元数据请求上接收答复的等待时间队列的总数 | |
| * | reply.avgtime | 在元数据请求上接收答复的等待时间队列的平均时间 | |
| * | lat.avgcount | 处理元数据请求的等待时间队列的平均数 | |
| * | lat.sum | 处理元数据请求的等待时间队列的总数 | |
| * | lat.avgtime | 处理元数据请求的等待时间队列的平均时间 | |
| * | wrlat.avgcount | 文件数据写入操作的等待时间队列的平均数 | |
| * | wrlat.sum | 文件数据写入操作的等待时间队列的总数 | |
| * | wrlat.avgtime | 文件数据写入操作的等待时间队列的平均时间 |
3. FS ObjectCacher-libcephfs Metrics Table
| 监控类型 | 监控项 | 说明 | 级别 |
|---|---|---|---|
| objectcacher-libcephfs | cache_ops_hit | 命中缓存 | |
| * | cache_ops_miss | 穿透缓存 | |
| * | cache_bytes_hit | 命中缓存大小 | |
| * | cache_bytes_miss | 穿透缓存大小 | |
| * | data_read | 读数据大小 | |
| * | data_written | 写缓存数据大小 | |
| * | data_flushed | 数据刷新 | |
| * | data_overwritten_while_flushing | 刷新时数据重写 | |
| * | write_ops_blocked | 肮脏限制延迟的写操作 | |
| * | write_bytes_blocked | 写入脏数据的限制 | |
| * | write_time_blocked | 由于脏数据限制而阻塞写入的时间 |