62:EAP日志体系、日志解读与日常日志运维

📅 2026/6/15 22:09:58
62:EAP日志体系、日志解读与日常日志运维
62EAP日志体系、日志解读与日常日志运维一、本课学习目标梳理EAP全量日志分类、作用、存储位置、命名规则掌握不同类型日志的关键字段、关键关键词识别方法学会通过日志快速定位联机、配方、报警、工单、通信类故障建立日志留存、轮转、清理、备份的标准化运维规范规避日志滥用、日志泄露、日志丢失带来的生产追溯风险二、EAP日志整体分类与定义EAP日志按照来源与用途分为五大类不同厂商目录结构略有差异但逻辑一致1. 通信交互日志SECS/GEM Raw Log内容完整收发的SECS/GEM原始报文SxFy、W位、数据体、时间戳、设备ID作用定位报文丢包、格式错误、T3超时、握手异常、设备无应答等底层通信问题特点数据量大每条交互均会记录是协议层面排障的最核心依据2. 业务处理日志EAP Application Log内容EAP内部业务逻辑执行记录包含工单接收/下发、配方下载/激活、事件解析、状态变更、权限拦截、过滤规则生效记录作用判断EAP软件自身是否正常解析、转发、执行自动化逻辑特点可读性高于原始报文用于上层业务故障排查3. 系统服务运行日志内容EAP服务启动/停止、重载配置、内存/线程异常、数据库读写、接口连接状态、报错堆栈信息作用排查EAP程序崩溃、卡死、配置加载失败、服务异常等软件本身问题4. 告警与事件汇总日志内容格式化后的报警记录、CEID事件记录简化原始报文展示可读信息报警编号、描述、触发/清除时间、对应机台作用日常快速查看产线异常用于交接班、问题初步筛查5. 跨系统接口日志EAP‑MES / EAP‑FDC内容EAP与MES、FDC等上游系统之间的交互报文、连接状态、应答超时、数据转发记录作用定位工单、生产履历、Trace数据无法上报上层系统的问题三、日志通用关键字段与命名规则1. 通用关键字段时间戳精确到毫秒用于定位故障发生时序核对先后逻辑设备标识EQP ID区分多机台日志归属日志级别DEBUG/INFO/WARN/ERROR/FATAL快速区分信息、警告、严重错误模块标识通信模块、配方模块、工单模块、报警模块定位故障所属功能模块2. 常见故障关键词识别关键词含义排查方向T3 TimeoutSECS应答超时网络波动、机台负载高、参数设置不合理Link Disconnect链路断开物理/网络/HSMS参数/设备侧服务问题DeviceID MismatchDeviceID不匹配核对两端HSMS配置Recipe Not Found配方不存在配方名称/映射/存储问题Permission Denied权限拒绝目录/服务权限、设备LOCAL模式Config Load Failed配置加载失败配置语法、路径、文件损坏四、不同场景日志快速排查方法场景1机台无法联机、OFFLINE优先查看通信交互日志看是否发出S1F1、有无S1F2应答查看系统日志确认EAP通信模块是否正常运行出现Link Disconnect/T3 Timeout排查网络、HSMS参数、机台服务场景2Recipe下发/激活失败业务日志查看配方下载请求、校验结果、拦截原因通信日志核对S7系列报文交互是否完整系统日志查看是否存在存储不足、权限报错场景3报警不上报/乱报通信日志确认机台是否发出S5报文业务日志查看是否被过滤规则拦截、解析异常汇总日志核对格式化后的报警信息是否同步更新场景4工单无法接收/无法闭环接口日志检查EAP‑MES通信状态、报文收发业务日志查看工单校验、状态流转、拦截规则五、日志标准化运维规范1. 日志留存规范量产环境生产相关日志工单、Lot、报警、生产履历最低留存90天满足追溯要求不良、重大异常日志永久归档备份调试类DEBUG日志可按需缩短留存时间2. 日志轮转与清理开启日志自动轮转按文件大小/日期分割日志避免单文件过大、IO性能下降定时清理超期日志禁止删除未到期生产追溯日志清理动作必须留痕记录清理时间、文件范围、操作人3. 日志备份与安全规范重大变更、新机上线、版本升级前备份对应时段日志日志包含生产数据、设备信息禁止随意外传、拷贝至非厂区设备日志访问设置权限管控仅授权运维人员可查看4. 调试日志管控量产环境默认关闭大量DEBUG调试日志避免磁盘快速占满、影响系统性能排查特定问题时临时开启问题解决后立即关闭。六、日志使用常见误区只看格式化汇总日志忽略原始通信日志汇总日志经过解析过滤原始报文才是协议问题最终依据不看时间戳乱序排查故障存在时序先后时间戳是梳理逻辑的核心过度开启DEBUG日志长期运行导致磁盘爆满、系统卡顿随意删除生产日志违反追溯规范出现质量问题无法复盘七、本课核心总结EAP日志分为通信交互日志、业务处理日志、系统运行日志、告警事件汇总日志、跨系统接口日志。时间戳、设备ID、日志级别、模块是日志四大核心标识特定关键词可快速定位故障大类。不同故障对应查看不同日志类型协议问题查原始通信日志业务问题查应用日志。生产类日志最低留存90天做好轮转、清理、备份、权限管控。避免日志使用误区合理开启调试日志保障系统性能与数据安全。八、课后小作业EAP五大类日志分别是什么T3 Timeout关键词代表什么故障含义生产相关日志最低需要留存多久排查SECS协议层面问题优先查看哪一类日志量产环境长期开启DEBUG调试日志有什么弊端