心电自监督分类论文分享(1)-read your heart

📅 2026/7/3 17:50:37
心电自监督分类论文分享(1)-read your heart
READING YOUR HEART研究背景与动机现有心电自监督学习分为对比学习、重构学习两类但全部把心电当做普通时序信号采用固定窗口、固定步长切割波形存在两个核心缺陷丢失心电专属形态、节律特征破坏心跳间潜在语义关系为了解决这两个问题作者提出了完整的自监督学习框架HeartLang把单词心跳当做单词把连续心律当做句子从心跳形态、全局节律两层学习通用表征数据集与实验任务预训练数据集MIMIC-IV原始采样率500Hz同一下下采样至100Hz划分9:1训练和验证集下游测试数据集PTB-XL CSPC2018 CSN评价指标macro AUC设置1%10%100%三种标注比例验证小样本泛化能力。架构图与核心方法整体框架图分为四步QRS-Tokenizer从原始心电信号生成心电句子向量量化构建心电词库掩码心电句子预训练下游任务微调下面对四步进行详解QRS-Tokenizer 基于 QRS 波定位自适应分割心跳先带通滤波 Ricker 小波积分检测每个 QRS 波峰以 QRS 为中心截取单心跳片段单心电单词心率自适应拼接为心电句子长度上限 256不足补零、过长截断。区别于固定窗口完全贴合心跳生理边界。ST-ECGFormer专门为心电设计的Transformer编码器一维卷积将单心跳映射为高维Token可学习空间嵌入时序嵌入位置嵌入融合导联空间、时序上下文信息。VQ-HBR 向量量化心跳重构形态层级表征学习构建超大离散心电词表 V8192 个通用心电单词用余弦相似度将不同人相似心跳映射至同一词向量消除个体生理差异通过 Transformer 解码器还原原始心电MSE 量化重构损失训练词库学习心跳形态特征。掩码心电句子预训练节律层级表征学习随机 50% 掩码句子内的心跳单词基于未掩码上下文预测被掩码心跳对应的词表索引交叉熵损失建模心跳间上下文语义捕捉全局心律依赖。实验结果与结论线性微调的实验结果在 PTB-XL 全部四类心电任务下HeartLang 在 1%/10%/100% 标注数据下 AUC 全面超越所有对比自监督方法相比第二名平均提升 8.14尤其在心电形态、节律分类任务提升超 9.85局限性与发展优势生理贴合完全基于心电 QRS 波生理结构建模不粗暴均等切分信号保留形态 节律双层医学特征泛化性强超大词库 时空 Transformer小样本场景提升明显适配 1 导联至 12 导联各类设备通用性预训练表征可适配心律失常、心肌病变等上百种心电下游诊断任务开源可复现数据集、代码全部公开提供完整超参、数据集划分方案。局限性QRS-Tokenizer 依赖清晰完整的 QRS 波形畸形、碎裂 QRS 波识别效果差基线漂移严重的数据集零填充会破坏原始心跳基线特征性能下降词库训练、掩码预训练双阶段流程算力开销较大需要多卡 4090 训练仅基于单一心电模态未融合血氧、血压等多生理信号。未来拓展方向优化 QRS 分词器增强基线漂移、畸形 QRS 波形下分割鲁棒性轻量化网络与近似量化算法降低 VQ 词库训练算力消耗融合多模态生理信号心电 血压 血氧构建多模态心电语言模型拓展零样本、少样本心电诊断适配基层缺少标注医疗场景基于心电词库做生成任务生成仿真心电辅助医疗教学与数据增广。github地址论文源码地址