PostgreSQL开源免费企业级数据库常用的监控项有哪些?
零,总序
数据是企业的宝贵资源,数字化是企业发展必由之路,数据库的安全、稳定、高效和企业生产发展息息相关。如何用好数据库,用好PostgreSQL那就少不了数据库的眼睛和耳朵,监控系统。下面简单介绍下PostgreSQL数据库监控系统的常用监控项,这些都是企业级实用监控项。一,主机层面
1,CPU使用率,分系统CPU使用率和用户CPU使用率
2,MEM,总内存,可用内存,已用内存,内存使用率
3,DISK,总空间,可用空间,已用空间,磁盘使用率
4,NET,分上传速率和下载速率
5,磁盘IOPS,分读取和写入
6,LOAD,1、5、15分钟LOAD
7,网络Socket连接,
8,打开的文件描述符
9,IO耗时,读耗时和写耗时
10,上下文切换次数二,DB层面
1,TPS
2,QPS
3,PG慢SQL日志
4,DB的响应时间
5,PG数据库版本
6,DB的活动连接个数(OLTP系统活动连接正常情况下低于20个,甚至10个以下)
7,DB连接使用率 (防止连接数大于等于最大连接,可能导致主从断开或者业务断连)
8,DB的最大连接
9,DB已使用连接
10,PG数据库的AGE(存在单实例多库情况,防止事物XID回卷)
11,PG库前10大AGE的表(和PG可用的事物XID相关,防止事物XID回卷)
12,PG物理复制状态是否为streaming(主从库或者级联从库复制状态)
13,PG逻辑复制主从差异
14,PG物理复制主从差异
15,数据库当前的空间大小
16,PG库TOP N CPU、CALL、PER_TIME、ROWS等
17,Dead Lock、排他锁(变更类型可能导致重写表甚至线上故障)
18,WAL生成速率,checkpoint、buffer hit、rollback 等
19,DB未提交的长事物(PG的MVCC机制原因必须要监控,否则容易膨胀或者故障)
20,PG逻辑复制槽状态是否为f(PG12版本前复制槽状态长时间为f时会导致Wal积压,磁盘爆掉,PG12后有参数可以控制最大积压量)