# V8系统巡检指导手册

# 系统巡检标准手册

【腾讯文档】V8部署巡检清单样单 https://docs.qq.com/sheet/DR3VlclZHSkNJS3VR?tab=o9voza 【飞书文档】巡检讲解和案例演示 https://fcndlqpk2w3r.feishu.cn/wiki/H1wMweu7EilZBmkfU3wc5C9LnOf?fromScene=spaceOverview

# 一键巡检脚本

V8轻量化系统运维巡检工具V2.0

工具功能简介:

  • 通过 SSH 远程巡检服务器、数据库、中间件等 IT 基础设施,生成 Excel 报告。
  • Shell脚本无需申请额外资源,无需连接AI模型,适用于资源少或者无法安装监控的客户

工具实现基座:基于OpenCode Agent智能体开发工具完成脚本自动编写

使用说明

  • 下载地址:https://frontend-project-dev.oss-cn-beijing.aliyuncs.com/software/v8-env-scan-tool.zip

功能特点

  • 模块化设计:每个服务独立模块,易于维护和扩展
  • 配置化管理:通过配置文件管理所有服务,无需修改代码,一次配置后续无需修改
  • 纯 Shell + Go:无需配置ai模型和工具,适合内网环境
  • Excel 输出:每个巡检类型独立 Sheet,中文表头,方便查看
  • SSH 端口支持:所有服务都支持自定义 SSH 端口(默认 22)
  • 集群巡检:支持同时集群多节点巡检
  • 同时支持本地和远程:远程巡检所有服务,需要做ssh免密或者交互手动输入密码;本地执行,适配只能通过跳板机登录的客户
  • 告警配置: 设置巡检项阈值,不满足阈值页签显示告警,不满足项标注颜色

支持的巡检类型

  • 服务器:CPU、内存、磁盘(系统盘 + 数据盘)、系统限制
  • mysql:版本、连接状态、字符集、最大连接数、空闲超时、事务隔离级别、时区、磁盘 IO
  • redis:内存配置、已用内存、连接数、集群状态、节点 IP
  • kafka:连接状态、ZK 健康度、集群健康度、分区配置、副本配置、日志保留、Topic 副本数、JVM 配置、资源使用
  • elasticsearch:JVM 配置、IK 插件、密码认证、集群状态、节点 IP
  • nacos:JVM 配置、CPU/内存使用、数据库配置、集群状态
  • clickhouse:内存配置、服务器内存占比、日志表清理空间、日志表清理策略
  • 对象存储:MinIO/OSS/OBS 连接状态、集群状态、公共桶只读验证
  • nginx:worker_rlimit_nofile、worker_connections
  • k8s:k8s版本、证书过期时间、Deployment 配置、resources、JVM 参数、dump日志挂载
  • 达梦:状态、列统计信息收集、大小写敏感、字符集、连接、表空间

目录结构

system-inspect/
├─ inspect.sh             #脚本总入口
├─ config/
│  └─ hosts.conf          #配置文件
├─ modules/
│  ├─ *.sh                # 服务巡检模块
│  └─ dm/
│     ├─ main.go
│     ├─ go.mod
│     ├─ dm-collector-amd64
│     └─ dm-collector-arm64
├─ remote/
│  ├─ loader.sh
│  └─ *.sh                # 远程执行模块
└─ scripts/
   ├─ excel-gen.go
   ├─ excel-gen-amd64
   └─ excel-gen-arm64

使用示例

  • 巡检所有服务:bash inspect.sh -c config/hosts.conf
  • 指定服务:bash inspect.sh -c config/hosts.conf -s server -s redis -s mysql
  • 指定输出文件位置:bash inspect.sh -c config/hosts.conf -o my_inspection.xlsx
  • 执行时间: 全量执行大约5到10分钟

执行结果查看 1779765945061.jpg

适用场景

  • 日常巡检:查看当前系统状态,cpu、内存、磁盘使用情况,配置信息查看
  • 问题初步排查:查看当前是否有服务异常,指标超高问题,节点异常

使用建议

  • 项目版本升级完成巡检
  • 重点项目定期巡检
  • 遇到问题初步巡检定位

技术支持

  • 使用问题和建议联系总部运维刘俊(交付与客成事业部-集约交付与客开管理部-运维及平台建设部)
  • 巡检问题协助分析 - 技术服务支持申请单上报给总部协助分析
编撰人:het、liujun