2007-2024年 供应链风险数据文本分析法 +文献

📅 2026/7/4 4:23:50 👁️ 阅读次数 📝 编程学习
2007-2024年 供应链风险数据文本分析法 +文献

1、数据概述

该数据集以蓝发钦等(2025)发表于《数量经济技术经济研究》的文本挖掘方法论为基础,系统测度了2007年至2024年间A股上市公司的供应链风险感知水平。其核心思路在于:从上市公司年度报告“管理层讨论与分析”(MD&A)部分的文本中,自动捕获同时触及“供应链”与“风险”主题且不含积极情感色彩的语句,并计算此类语句在全部风险相关语句中的占比,以此作为企业层面供应链风险程度的量化指标。该方法不依赖事后财务数据,而是直接从事前信息披露中提取管理层对风险的主观判断,具有较强的时效性与前瞻性。2007-2024年供应链风险数据文本分析法+文献资源-CSDN下载https://download.csdn.net/download/2401_84585615/93042804

参考文献:蓝发钦,胡晓敏,国文婷,等.企业供应链风险与纵向并购决策之谜——来自文本挖掘的经验证据[J].数量经济技术经济研究,2025,42(01):116-135

2、关键指标

数据集所涉字段包括:股票代码、仅含风险词的句子数、同时包含风险词汇与供应链词汇的句子数、同时包含风险词汇与供应链词汇但不含积极情感词汇的句子数,以及最终的供应链风险指标。其中,供应链风险指标由“风险与供应链交叉且非积极语句数”除以“全部风险语句数”得到,数值越高,表明企业在公开披露中对供应链风险的负面感知越突出。这一算法通过预设的词汇表(涵盖风险词、供应链主题词及积极情感词)进行匹配,既保证了指标的可复现性,也避免了人工标注的主观偏差,为后续实证研究提供了标准化的风险度量工具。