# V8系统巡检指导手册
# 系统巡检标准手册
【腾讯文档】V8部署巡检清单样单 https://docs.qq.com/sheet/DR3VlclZHSkNJS3VR?tab=o9voza 【飞书文档】巡检讲解和案例演示 https://fcndlqpk2w3r.feishu.cn/wiki/H1wMweu7EilZBmkfU3wc5C9LnOf?fromScene=spaceOverview
# 一键巡检脚本
V8轻量化系统运维巡检工具V2.0
工具功能简介:
- 通过 SSH 远程巡检服务器、数据库、中间件等 IT 基础设施,生成 Excel 报告。
- Shell脚本无需申请额外资源,无需连接AI模型,适用于资源少或者无法安装监控的客户
工具实现基座:基于OpenCode Agent智能体开发工具完成脚本自动编写
使用说明
- 下载地址:https://frontend-project-dev.oss-cn-beijing.aliyuncs.com/software/v8-env-scan-tool.zip
功能特点
- 模块化设计:每个服务独立模块,易于维护和扩展
- 配置化管理:通过配置文件管理所有服务,无需修改代码,一次配置后续无需修改
- 纯 Shell + Go:无需配置ai模型和工具,适合内网环境
- Excel 输出:每个巡检类型独立 Sheet,中文表头,方便查看
- SSH 端口支持:所有服务都支持自定义 SSH 端口(默认 22)
- 集群巡检:支持同时集群多节点巡检
- 同时支持本地和远程:远程巡检所有服务,需要做ssh免密或者交互手动输入密码;本地执行,适配只能通过跳板机登录的客户
- 告警配置: 设置巡检项阈值,不满足阈值页签显示告警,不满足项标注颜色
支持的巡检类型
- 服务器:CPU、内存、磁盘(系统盘 + 数据盘)、系统限制
- mysql:版本、连接状态、字符集、最大连接数、空闲超时、事务隔离级别、时区、磁盘 IO
- redis:内存配置、已用内存、连接数、集群状态、节点 IP
- kafka:连接状态、ZK 健康度、集群健康度、分区配置、副本配置、日志保留、Topic 副本数、JVM 配置、资源使用
- elasticsearch:JVM 配置、IK 插件、密码认证、集群状态、节点 IP
- nacos:JVM 配置、CPU/内存使用、数据库配置、集群状态
- clickhouse:内存配置、服务器内存占比、日志表清理空间、日志表清理策略
- 对象存储:MinIO/OSS/OBS 连接状态、集群状态、公共桶只读验证
- nginx:worker_rlimit_nofile、worker_connections
- k8s:k8s版本、证书过期时间、Deployment 配置、resources、JVM 参数、dump日志挂载
- 达梦:状态、列统计信息收集、大小写敏感、字符集、连接、表空间
目录结构
system-inspect/
├─ inspect.sh #脚本总入口
├─ config/
│ └─ hosts.conf #配置文件
├─ modules/
│ ├─ *.sh # 服务巡检模块
│ └─ dm/
│ ├─ main.go
│ ├─ go.mod
│ ├─ dm-collector-amd64
│ └─ dm-collector-arm64
├─ remote/
│ ├─ loader.sh
│ └─ *.sh # 远程执行模块
└─ scripts/
├─ excel-gen.go
├─ excel-gen-amd64
└─ excel-gen-arm64
使用示例
- 巡检所有服务:bash inspect.sh -c config/hosts.conf
- 指定服务:bash inspect.sh -c config/hosts.conf -s server -s redis -s mysql
- 指定输出文件位置:bash inspect.sh -c config/hosts.conf -o my_inspection.xlsx
- 执行时间: 全量执行大约5到10分钟
执行结果查看

适用场景
- 日常巡检:查看当前系统状态,cpu、内存、磁盘使用情况,配置信息查看
- 问题初步排查:查看当前是否有服务异常,指标超高问题,节点异常
使用建议
- 项目版本升级完成巡检
- 重点项目定期巡检
- 遇到问题初步巡检定位
技术支持
- 使用问题和建议联系总部运维刘俊(交付与客成事业部-集约交付与客开管理部-运维及平台建设部)
- 巡检问题协助分析 - 技术服务支持申请单上报给总部协助分析
编撰人:het、liujun