上市公司大数据应用数据集 📅 2026/7/5 13:54:28 一、基础概况数据编号1686时间跨度2001–2023 沪深 A 股年度平衡面板数据源上市公司年报全文文本Python 文本分词统计测算范式对标柏淑嫄等2024《世界经济》标准化词频测算方法核心指标大数据应用程度由大数据类关键词总词频标准化对数得到存储格式Excel 企业年度面板提供分项关键词原始频次与合成指数二、关键词词典与指标测算1 大数据配套关键词集合大数据、数据挖掘、文本挖掘、数据可视化、异构数据、征信、增强现实、AR、混合现实、MR、虚拟现实、VR、数据科学2 标准化计算公式\(大数据应用程度\ln(关键词总词频1)\) 先汇总当年年报内全部关键词出现总次数1 消除零值无法取对数问题数值越高代表企业大数据、数据类技术布局与落地披露程度越高。3 数据预处理规则以年报全文总词数作为控制基准规避年报篇幅长短带来的词频偏差统一分词、剔除虚词干扰人工校验歧义词汇。三、完整面板字段股票代码公司简称年份 年报全文总词数大数据类关键词总频次 分项关键词单类频次大数据 / 数据挖掘 / 数据可视化等 大数据应用程度核心对数指数四、适配实证研究方向大数据与 ESG、绿色发展对标原文主题检验大数据技术应用对企业 ESG 综合得分、绿色创新、环保投入、公益捐赠的驱动机制。供应链运营优化搭配长鞭效应数据研究大数据分析能否降低需求信息扭曲、缓解库存积压、平滑供应链波动。公司治理与信息透明度分析大数据应用改善内部管控、降低盈余管理、减少股价崩盘风险、提升信息披露质量。数字化分层异质性检验区分大数据底层数据技术、数字化广度 / 深度综合数字转型对比二者对创新、绩效的差异化作用。创新与全要素生产率大数据赋能研发预测、市场分析检验其对专利产出、创新韧性、企业生产效率的提升效应。高管特征交互机制匹配高管数字背景、团队稳定性检验数字高管是否放大大数据技术的经济价值。区域文化调节效应结合茶文化指数等非正式制度变量分析地方商务文化对企业大数据落地的调节作用。五、数据核心优势测算方法出自《世界经济》顶刊文本词频范式成熟审稿认可度高区分大数据专项词汇与泛数字化词汇精准聚焦数据挖掘、数据中台类技术度量精准度更高2001-2023 超长时序覆盖大数据产业萌芽、爆发、深度应用完整周期同步输出单类关键词原始频次可单独拆分数据挖掘、VR/AR 赛道做细分研究可无缝对接数字化广度深度、AI 专利、供应链长鞭效应、高管特征等全部 A 股配套数据集。数据展示参考文献[1]柏淑嫄,潘子成,曹伟,等.企业大数据应用对ESG评价的影响[J/OL].世界经济,2024,(08):133-167[2024-09-19].https://doi.org/10.19985/j.cnki.cassjwe.2024.08.005.