数据库
oracle数据库自启动和关闭脚本调用
数据库灾备恢复小结
DMS使用文档
Oracle12C安装文档_李光升
Centos配置yum源的操作步骤-李光升
CCS数据库突然卡顿问题解决-徐铭
Centos 7.9静默安装oracle 12cR2详细步骤
mysql5.7数据库sql语句数据类型隐式转换的反逻辑BUG
RDS MySQL临时文件导致实例磁盘空间满且出现“锁定中”状态
关于Mysql引擎Myisam和InnoDB的使用
MySQL查询语句中in和exists区别详解-知识点
Mysql 的存储过程中 WITH AS 的语法和使用
Mysql 性能调优-详解
oracle数据库DG搭建
SUSE linux 配置时钟同步服务NTP/Chrony
oracle数据库实例开启操作文档
oracle数据库实例关闭操作文档
oracle数据库DBS备份配置文档v2
ALiYun ECS CENTOS数据上传到OSS操作手册
Oracle - LOGMINER配置方法
oracle sysaux表空间爆满清理unified auditing数据
sysaux表空间爆满WRI$_ADV_OBJECTS占用严重
SAP权限对象
SYSAUX表空间WRI$\_ADV\_OBJECTS表过大清理V2
oracle:表访问方式
ORA性能诊断调优
数据字典(DICT)和性能事件类型(EVENT)
日志挖掘LogMiner
RMAN sql_id “0az7czjdw8z7j” 执行计划异常
Oracle11g Active Data Guard搭建、管理
ORACLE LOGMINER配置v2
oracle日志组调整
ECS linux服务器挂载nas磁盘失败
oracle数据库修改字符集
datapump数据泵导入导出
OA系统数据库ADG架构搭建
IPS数据库SQL执行异常:ORA-00600
oracle 12c 创建PDB
oracle数据库监听异常
lvm:阿里云磁盘扩容,lvm扩容
Redis基本操作
SAP S4 CLIENT COPY(800->400)
日常数据库操作
PGSQL操作
# ORA-00054: resource busy问题处理
OA数据库服务器故障分析报告
CCS数据库生产数据库(北京中心)覆盖到VER环境数据库(乌兰察布):使用nonpdb to pdb迁移方式
WINDOWS环境Django框架连接MySQL数据库配置
Django开发学习实战
什么是向量嵌入?
OA数据库服务器内次异常增长问题分析
基于AI的自动化服务器管理
AI技术发展趋势及其在农牧食品行业的创新应用
IPS数据库日志表数据归档&表分区
国产编程模型GLM-4.6海外爆火:性能媲美ClaudeSonnet,性价比优势显著
免费开源的零代码平台 / 无代码平台,敲敲云 v2.2.0 版本
数据库原理与应用
AI发展近况分析
ORACLE ADG环境下解除ADG关系并激活备库为独立数据库
麦肯锡重磅报告:关于未来的生存指南,当57%的工作被自动化,我们如何与AI结成利益共同体
【Oracle】Cursor(游标)
ORACLE数据库在曾经的备库(路径一致)进行不完全恢复
获取执行计划的6种方法
人工智能行业的发展已进入“系统竞争”时代
2026年AI与机器人发展趋势
事务未提交导致行锁等待问题处理
MongoDB日常操作命令
2026年人工智能前沿技术趋势与应用落地分析
Doris开发
本文档使用「觅思文档专业版」发布
-
+
首页
OA数据库服务器内次异常增长问题分析
# OA数据库服务器内次异常增长问题分析 ## 一、问题描述 时间:2025/08/18 09:17 服务器:10\.7\.8\.8 问题概述:数据库服务器的oracle数据库服务被中断,导致OA系统不可用 ## 二、问题分析 1、 服务器资源分析(服务器的cpu/内存/磁盘读写在1\-2分钟内全部跑满)  (CPU)  (内存)  (磁盘io) 2、 数据库告警日志分析:oracle KSRPMON进程异常,数据库连接KSRPMON超时,直接导致数据库宕掉,  (告警日志:9点10\+分时间段的日志信息)  (告警日志:宕机后发生数据块异常告警) 3、 数据库服务器系统日志分析: OOM杀掉了oracle/edr/alicloud等的部分进程(KSRPMON进程)  (dmesg分析)  (OS messages日志) 4、资源跑高原因分析 1\) EDR原因排查:基本排除 EDR内存耗用排查:深信服反馈EDR软件使用内存几十兆左右; EDR内存泄漏可能性排查:无泄漏 2\)ORACLE数据库排查:当时服务器top 5进程皆为oracle进程  (2025/08/18 09:13:45 top 5 进程) 3\)AWR报告分析:sql\_id\=’[**2q36jkyj2u7rm**](file:///C:\Users\XUM\Desktop\awrrpt_1_41082_41083.html#2q36jkyj2u7rm)’ 在执行时间/cpu使用率等耗用较高(该值取自数据库8点\-9点数据库快照,9点\-10点快照因数据库中断原因无法获取)  以上,问题复盘如下: 1. **源头 (09:10 AM)**:应用端**高负载操作**(很可能是sql\_id\=’[2q36jkyj2u7rm](file:///C:\Users\XUM\Desktop\awrrpt_1_41082_41083.html#2q36jkyj2u7rm)’)开始运行,它产生了海量的读写操作。 2. **I/O瓶颈 (09:10 AM)**:巨大的读写流量瞬间淹没了磁盘 **vdb** 的I/O处理能力。 * 磁盘利用率 %util 爆表(71%)。 * I/O响应时间 await 飙升到灾难性的 **61毫秒**。 3. **系统僵死 (09:10 \- 09:14\)**:由于I/O是系统最慢的组件,I/O瓶颈导致: * **CPU**:因等待I/O完成而空闲。 * **内存**:因Oracle进程无法及时将数据写入磁盘,脏数据在内存中堆积,可用内存逐渐耗尽。 * **进程**:所有依赖I/O的进程(包括Oracle和EDR)都卡在等待状态。 4. **EDR崩溃 (09:14:57\)**:EDR进程 (edr\_agent) 在尝试执行文件扫描或系统调用时,因系统资源极度紧张(特别是I/O无响应)而**发生段错误**。它是系统僵死的**受害者**和**指示灯**。 5. **最终崩溃 (09:16:24\)**:内存最终被耗尽,触发OOM\-Killer,杀死Oracle关键进程,导致 ORA\-16198 和实例终止,并最终留下数据块损坏 ORA\-01578。 ## 三、处理及总结 1、停用EDR:已完成 2、持续观察oracle数据库告警日志文件/系统日志messages:关闭EDR后,系统messages未发生edr 段错误,alert.log未发现ORA\-01578/ORA\-01110报错。 3、修复损坏的数据块:确定已修复,重建索引OA. IDX\_INFO\_READ\_US  4、优化sql\_id\=[2q36jkyj2u7rm](file:///C:\Users\XUM\Desktop\awrrpt_1_41082_41083.html#2q36jkyj2u7rm):已完成,添加索引后可以大大降低该语句的资源消耗: create index OA.IDX\_HRMRESOURCE\_WORKCODE on OA.HRMRESOURCE("WORKCODE"); create index OA.IDX\_HRMLEADERINFO\_EMP\_LECODE on OA.HRMLEADERINFO("employee\_code","leader\_code"); 5、调整sql\_id\=[2q36jkyj2u7rm](file:///C:\Users\XUM\Desktop\awrrpt_1_41082_41083.html#2q36jkyj2u7rm)相关作业的执行时间:尽量避开早上8点半\-10点半时间段,该时间段为OA系统繁忙时间段,特别是每周一早上9点左右是最繁忙的时候,应尽量避开。 6、sql\_id\=[2q36jkyj2u7rm](file:///C:\Users\XUM\Desktop\awrrpt_1_41082_41083.html#2q36jkyj2u7rm)语句为全量更新全部人员的上级,该SQL每次执行35s左右,在8/18日早上8点\-9点之间累计执行了17次,9点\-10点之间执行次数不可统计: UPDATE HRMRESOURCE D1 SET ( D1\.managerid ) \= ( SELECT H2\.ID AS managerid FROM HRMRESOURCE H JOIN HRMLEADERINFO L ON L."employee\_code" \= H.WORKCODE JOIN HRMRESOURCE H2 ON L."leader\_code" \= H2\.WORKCODE WHERE D1\.WORKCODE \= H.WORKCODE ) WHERE D1\.WORKCODE IS NOT NULL
徐铭
2025年8月20日 14:56
转发文档
收藏文档
上一篇
下一篇
手机扫码
复制链接
手机扫一扫转发分享
复制链接
Markdown文件
Word文件
PDF文档
PDF文档(打印)
分享
链接
类型
密码
更新密码
有效期