openGauss这么多工具?到底要选哪个?(92)

193 阅读16分钟

#openGauss #入门 #安装 #数据库 #开源

知识来源:docs-opengauss.osinfra.cn/zh/

表 1 openGauss状态检查表

状态

巡检项

检查内容

是否支持--set

os

CheckCPU(检查CPU使用率)

检查主机CPU占用率,如果idle大于30%并且iowait小于30%。则检查项通过,否则检查项不通过。

CheckFirewall(检查防火墙状态)

检查主机防火墙状态,如果防火墙关闭则检查项通过,否则检查项不通过。

CheckTimeZone(检查时区一致性)

检查openGauss内各节点时区,如果时区一致则检查通过,否则检查项不通过。

CheckSysParams(检查系统参数)

检查各节点操作系统参数,判断是否等于预期值。检查项不满足warning域则报warning,不满足NG域则检查项不通过,并打印不满足项。

详见操作系统参数

CheckOSVer(检查操作系统版本)

检查openGauss内各个节点的操作系统版本信息,如果满足版本兼容列表且openGauss在同一混搭列表中则检查通过,否则检查不通过。

CheckNTPD(检查NTPD服务)

检查系统NTPD服务,如果服务开启且各节点时间误差在1分钟以内则检查项通过,否则检查项不通过。

CheckTHP(检查THP服务)

检查系统THP服务,如果服务开启则检查项通过,否则检查项不通过。

CheckSshdService(检查sshd服务是否已启动)

检查系统是否存在sshd服务,若存在则检查项通过,否则检查项不通过。

CheckCrondService(检查crontab服务是否已启动)

检查系统是否存在crontab服务,若存在则检查项通过,否则检查项不通过。

CheckCrontabLeft(检查crontab是否有残留Gauss相关信息)

检查crontab是否残留Gauss相关信息,若无该信息则检查项通过,否则检查项不通过。

CheckDirLeft(检查文件目录是否有残留)

检查文件目录(/opt/huawei/Bigdata/ ,/var/log/Bigdata/, /home/omm)是否存在,(若mount目录包含此目录则忽略)若不存在则查项通过,否则检查项不通过。

CheckProcessLeft(检查进程是否有残留)

检查是否残留gaussdb和omm进程,若未残留则检查项通过,否则检查项不通过。

CheckStack(栈深度检查)

检查栈深度,若各个节点不一致则报warning ,若大于等于3072则检查项通过,否则不通过。

CheckOmmUserExist(检查omm用户是否存在)

检查是否存在omm用户,若不存在omm用户则检查项通过,否则检查项不通过。

CheckPortConflict(检查数据库节点端口是否占用)

检查数据库节点端口是否已被占用,若未占用则检查项通过,否则检查项不通过。

CheckSysPortRange(检查ip_local_port_range设置范围)

检查ip_local_port_range系统参数范围,若范围在26000~65535则检查项通过,否则检查项不通过。

CheckEtcHosts(检查/etc/hosts中是否有重复地址以及localhost配置)

检查/etc/hosts没有配置localhost检查项不通过,存在带有#openGauss注释的映射则检查项不通过,相同IP不同hostname则检查项不通过,否则通过,若hostname相同,但ip不同检查项不通过。

CheckCpuCount(检查CPU核数)

检查CPU核心与可用CPU不符检查项不通过,相符但存在不可用信息Warning。 所有节点CPU信息不相同检查项不通过。

CheckHyperThread(检查超线程是否打开)

检查超线程,若打开则检查项通过,否则检查项不通过。

CheckMemInfo(检查内存总大小)

检查各节点总内存大小是否一致,若检查结果一致,则检查项通过,否则报warning。

CheckSshdConfig(检查sshd服务配置是否正确)

检查/etc/ssh/sshd_config文件,

(a)PasswordAuthentication=yes;

(b)MaxStartups=1000;

(c)UseDNS=no;

(d)ClientAliveInterval大于10800或者等于0

配置如上所示则检查项通过,若a、c配置不正确则报warning,b、d配置不正确则检查项不通过。

CheckMaxHandle(检查句柄最大设置)

检查操作系统最大句柄值,如果该值大于等于1000000则检查项通过,否则检查项不通过。

CheckKernelVer(检查内核版本)

检查各节点系统内核版本信息,如果版本信息一致则检查项通过,否则报Warning。

CheckEncoding(检查编码格式)

检查openGauss内各个节点的系统编码,如果编码一致则检查项通过,否则检查项不通过。

CheckBootItems(检查启动项)

检查是否有手动添加的启动项,如果没有则检查通过,否则检查不通过。

CheckDropCache(检查DropCache进程)

检查各节点是否有dropcache进程在运行,若有则检查通过,否则检查不通过。

CheckFilehandle(检查文件句柄)

此检查项检查以下两项,两项都通过为通过,否则为不通过:

  • 检查每个gaussdb进程打开的进程数是否超过80万,不超过则检查通过,否则检查不通过。
  • 检查是否有slave进程使用的句柄数超过master进程,如果没有则检查通过,否则检查不通过。

CheckKeyProAdj(检查关键进程omm_adj的值)

检查所有关键进程,如果所有关键进程的omm_adj值为0,则通过,否则不通过。

CheckMaxProcMemory(检查max_process_memory参数设置是否合理)

检查数据库节点的max_process_memory值,判断该参数的值是否大于1G,若不大于则检查项通过,否则检查项不通过。

device

CheckSwapMemory(检查交换内存)

检查交换内存和总内存大小,若检查结果为0则检查项通过,否则检查项报Warning大于总内存时检查项不通过。

CheckLogicalBlock(检查磁盘逻辑块)

检查磁盘逻辑块大小,若为512则检查项通过,否则检查项不通过。

CheckIOrequestqueue(检查IO请求)

检查IO值,如果该值为32768则检查项通过,否则检查项不通过。

CheckMaxAsyIOrequests(检查最大异步IO请求)

获取当前异步IO请求值,当前异步IO请求值大于当前节点数据库实例数*1048576和104857600则检查项通过,否则检查项不通过。

CheckIOConfigure(检查IO配置)

检查IO配置,如果是deadline则检查项通过,否则检查项不通过。

CheckBlockdev(检查磁盘预读块)

检查磁盘预读块大小,如果预读块大小为16384则检查项通过,否则检查项不通过。

CheckDiskFormat(检查磁盘格式参数)

检查磁盘XFS格式信息,如果配置为'rw,noatime,inode64,allocsize=16m'则检查项通过,否则报warning。

CheckInodeUsage(检查磁盘inodes使用率)

openGauss路径(GAUSSHOME/PGHOST/GPHOME/GAUSSLOG/tmp及实例目录)

检查以上指定目录使用率,如果使用率超过warning阈值(默认为60%) 报warning超过NG阈值(默认为80%)则检查项不通过,否则通过。

CheckSpaceUsage(检查磁盘使用率)

openGauss路径(GAUSSHOME/PGHOST/GPHOME/GAUSSLOG/tmp及实例目录)

检查磁盘以上指定目录(目录列表)使用率,如果使用率超过warning阈值(默认为70%) 报warning超过NG阈值(默认为90%)则检查项不通过。openGauss路径下检查GAUSSHOME/PGHOST/GPHOME/GAUSSLOG/tmp/data路径的剩余空间,不满足阈值则检查项不通过,否则通过。

CheckDiskConfig(检查磁盘空间大小一致性)

检查磁盘名大小挂载点是否一致,若一致则检查项通过,否则报warning。

CheckXid(检查CheckXid数值)

查询xid的数值,如果大于10亿报Warning,大于18亿则检查项不通过。

CheckSysTabSize(检查每个实例的系统表容量)

如果每一块磁盘的剩余容量大于该磁盘上所有实例的系统表容量总和则检查项通过,否则检查项不通过。

cluster

CheckClusterState(检查openGauss状态)

检查fencedUDF状态,如果fencedUDF状态为down则报warning;检查openGauss状态,如果openGauss状态为Normal则检查项通过,否则检查项不通过。

CheckDBParams(检查openGauss参数)

检查数据库主节点检查共享缓冲区大小和Sem参数。

数据库节点检查共享缓冲区大小和最大连接数。

共享缓冲区需要大于128KB且大于shmmax且大于shmall*PAGESIZE

若存在数据库主节点,则Sem值需大于(数据库节点最大连接数+150)/16向上取整。

以上项完全满足则检查项通过,否则检查项不通过。

CheckDebugSwitch(检查日志级别)

在各节点检查各实例的配置文件中log_min_messages参数的值,为空则认为是Warning,判断日志级别非waring,则报warning。

CheckUpVer(检查升级版本是否一致)

检查openGauss各个节点上升级包的版本,如果一致则检查项通过,否则检查项不通过。使用时,需指定升级软件包路径。

CheckDirPermissions(检查目录权限)

检查节点目录(实例Xlog路径、GAUSSHOME、GPHOME、PGHOST、GAUSSLOG)权限,如果目录有写入权限且不大于750则检查项通过,否则检查项不通过。

CheckEnvProfile(检查环境变量)

检查节点环境变量(GAUSSHOMEGAUSSHOME、LD_LIBRARY_PATH、$PATH),检查CMS/CMA/数据库节点进程的环境变量。如果环境变量存在并配置正确,进程的环境变量存在则检查项通过,否则检查项不通过。

CheckGaussVer(检查gaussdb版本)

检查各个节点gaussdb版本是否一致,如果版本一致则检查项通过,否则检查项不通过。

CheckPortRange(检查端口范围)

若ip_local_port_range的范围在阈值范围内(默认是26000 65535),并且实例端口不在ip_local_port_range范围内则检查项通过,否则检查项不通过。

CheckReadonlyMode(检查只读模式)

检查openGauss数据库主节点default_transaction_read_only值若为off则检查通过,否则不通过。

CheckCatchup(检查Catchup)

检查gaussdb进程堆栈是否能搜索到CatchupMain函数,若搜索不到则检查项通过,否则检查项不通过。

CheckProcessStatus(检查openGauss进程属主)

检查 'gaussdb'进程属主,若不存在omm以外的属主则检查项通过,否则检查项不通过。

CheckSpecialFile(特殊文件检查)

检查tmp目录(PGHOST)、OM目录(GPHOME)、日志目录(GAUSSLOG)、data目录、程序目录(GAUSSHOME)下文件是否存在特殊字符以及非omm用户的文件,若不存在则检查项通过,否则检查项不通过。

CheckCollector(检查openGauss的信息收集)

在output目录下查看信息收集是否成功,若收集成功则检查项通过,否则检查项不通过。

CheckLargeFile(检查数据目录大文件)

检查各个数据库节点目录是否存在超过4G的文件。任一数据库节点目录及其子目录有超过4G的单个文件,则检查不通过,否则检查通过。

CheckProStartTime(关键进程启动时间检测)

检查关键进程启动时间是否间隔超过5分钟,超过则检查不通过,否则检查通过。

CheckDilateSysTab(检查系统表膨胀)

检查系统表是否膨胀,若膨胀则不通过,否则检查通过。

CheckMpprcFile(检测环境变量分离文件改动)

检查是否存在对环境变量分离文件的改动,若存在则检查不通过,否则检查通过。

database

CheckLockNum(检查锁数量)

检查数据库锁数量,查询成功检查项通过。

CheckArchiveParameter(检查归档参数)

检查数据库归档参数,如果未打开或打开且在数据库节点下则检查项通过, 打开且不在数据库主节点目录下则检查项不通过。

CheckCurConnCount(检查当前连接数)

检查数据库连接数,如果连接数小于最大连接数的90%则检查项通过,否则检查项不通过。

CheckCursorNum(检查当前游标数)

检查数据库的游标数,检查成功则检查项通过,否则检查项不通过。

CheckMaxDatanode(检查comm_max_datanode参数值范围小于数据库节点个数)

检查最大数据库节点数,若最大数据库节点数小于xml配置的节点数*数据库节点数(默认值为90*5)报warning,否则检查项通过。

CheckPgPreparedXacts(检查残留两阶段事务)

检查pgxc_prepared_xacts参数,如果不存在二阶段事务则检查项通过,否则检查项不通过。

CheckPgxcgroup(检查pgxc_group表中需要重分布的个数)

检查pgxc_group表中需要重分布的个数,检查结果为0则通过, 否则不通过。

CheckLockState(openGauss是否被锁)

检查openGauss是否被锁,若openGauss被锁则不通过,否则检查项通过。

CheckIdleSession(检查业务停止)

检查非空闲会话数,如果数量为0则检查项通过,否则检查项不通过。

CheckDBConnection(检查数据库连接)

检查能否连接数据库,如果连接成功则检查项通过,否则检查项不通过。

CheckGUCValue(GUC参数检查)

检查(max_connections + max_prepared_transactions) * max_locks_per_transaction的值,若该值大于等于1000000则检查项通过,否则检查项不通过。

CheckPMKData(检查PMK异常数据)

检查数据库PMK schema是否包含有异常数据,如果不存在异常数据则检查项通过,否则检查项不通过。

CheckSysTable(检查系统表)

检查系统表,检查成功则检查项通过。

CheckSysTabSize(检查每个实例的系统表容量)

如果每一块磁盘的剩余容量大于该磁盘上所有实例的系统表容量总和则检查项通过,否则检查项不通过。

CheckTableSpace(检查表空间路径)

表空间路径和openGauss路径之间不能存在嵌套且表空间路径相互不能存在嵌套,则检查项通过,否则检查项不通过。

CheckTableSkew(检查表级别数据倾斜)

若存在表在openGauss各数据库节点上的数据分布不均衡,且分布数据最多的数据库节点比最低的数据库节点所分布的数据多100000条以上,则检查不通过,否则检查通过。

CheckDNSkew(检查数据库节点级别数据分布倾斜)

检查数据库节点级别的表倾斜数据,若分布数据最高的数据库节点比分布数据最低的数据库节点数据量高于5%,则检查不通过,否则检查通过。

CheckUnAnalyzeTable(检查未做analyze的表)

若存在未做analyze的表,并且表中至少包含一条数据,则检查不通过,否则检查通过。

CheckCreateView(创建视图检查)

创建视图时,如果查询语句中含有子查询,并且子查询结果查询解析和重写之后存在别名重复,检查不通过,否则检查通过。

CheckHashIndex(hash index语法检查)

如果存在hash index则检查不通过,否则检查通过。

CheckNextvalInDefault(检查Default表达式中包含nextval(sequence))

检查Default表达式中是否包含nextval(sequence),若包含则不通过,否则通过。

CheckNodeGroupName(Node group编码格式检查)

存在非SQL_ASCII字符的Node Group名称则检查不通过,不存在则检查通过 。

CheckPgxcRedistb(检查重分布残留的临时表 )

检查数据库中是否存在重分布残留的临时表,若不存在则检查通过,否则检查不通过 。

CheckReturnType(用户自定义函数返回值类型检查)

检查用户自定义函数是否包含非法返回类型,若包含则检查不通过,否则检查通过。

CheckSysadminUser(检查sysadmin用户)

检查除openGauss属主外是否存在数据库管理员用户,若存在则不通过,否则检查通过。

CheckTDDate(TD数据库中orc表date类型列检查)

检查TD模式数据库下的orc表中是否包含date类型的列,若包含检查不通过,否则检查通过。

CheckDropColumn(drop column检查)

如果存在drop column的表,则检查不通过,否则检查通过。

CheckDiskFailure(检查磁盘故障)

对openGauss中的所有数据做全量查询,若存在查询错误则检查不通过,否则检查通过。

network

CheckPing(检查网络通畅)

检查openGauss内所有节点的互通性,如果各节点所有IP均可ping通则检查项通过,否则检查项不通过。

CheckRXTX(检查网卡RXTX值)

检查节点backIP的RX/TX值,如果该值为4096则检查项通过,否则检查项不通过。

CheckMTU(检查网卡MTU值)

检查节点backIP对应的网卡MTU值( bond后的物理网卡要确保一致),如果该值不是8192或1500报warning若openGaussMTU值一致则检查项通过,否则检查项不通过。

CheckNetWorkDrop(检查网络掉包率)

检查各IP1分钟内网络掉包率,如果不超过1%则检查项通过,否则检查项不通过。

CheckBond(检查网卡绑定模式)

检查是否有配置BONDING_OPTS或BONDING_MODULE_OPTS,若没有配置则报warning。检查各节点bond模式是否一致,如果同时满足则检查项通过,否则检查项不通过。

CheckMultiQueue(检查网卡多队列)

检查cat /proc/interrupts,判断是否开启网卡多队列且绑定不同CPU,如果满足则检查项通过,否则检查项不通过。

CheckUsedPort(检查随机端口使用数量)

检查net.ipv4.ip_local_port_range,范围大于等于OS默认值通过(32768-61000);

检查TCP协议随机端口数,小于总随机端口数的80%通过。

CheckNICModel(网卡型号和驱动版本一致性检查)

检查各个节点的网卡型号以及驱动版本是否一致,一致则通过,否则报warning。

CheckRouting(本地路由表检查)

检查各节点在业务IP网段的IP个数,超过1个则报warning,否则检查通过。

CheckNetSpeed(检查网卡接收带宽,ping值,丢包率)

网络满载时,检查网卡平均接收带宽大于600MB通过;

网络满载时,检查网络ping值,小于1秒通过;

网络满载时,检查网卡丢包率,小于1%通过。

other

CheckDataDiskUsage(检查数据库节点磁盘空间使用率)

检查磁盘数据库节点目录使用率,如果使用率低于90%则检查项通过,否则检查项不通过。

说明: CheckNetSpeed检查项:

  • CheckNetSpeed不支持-L本地检查模式,-L模式无法构造网络压力,检查的结果不准确。
  • 在节点数小于6时,speed_test构造的网络压力可能无法跑满带宽,可能会造成检查结果不准确。

#openGauss #入门 #安装 #数据库 #开源

知识来源:docs-opengauss.osinfra.cn/zh/