第三节 研究设计
一、数据来源和研究变量的定义
参考现有研究(吴非等,2021),本研究选取企业数字化转型作为被解释变量,通过爬虫技术获取了上市公司年报中管理层讨论与分析关于数字化的描述,并汇总统计数字化转型相关词汇出现的次数。[4]本研究使用转型规模和转型强度作为企业数字化转型的度量指标。在解释变量方面,参考现有研究(潘越等, 2019b),本研究从上海古籍出版社出版的《中国家谱总目》整理并获取了清朝至1990年各地区的族谱数据,在此基础上整理各个地区的族谱卷数,并结合各省的人口数量构建地区层面宗族文化指标。本研究进一步控制了公司规模、公司年龄、盈利能力、负债水平、两职合一、机构投资者持股比例、股权制衡度、市场化程度、地区经济发展水平和地区外资水平对企业数字化转型的影响。上市企业财务数据来自CSMAR数据库。本研究选取A股上市企业2004—2018年数据,进一步剔除了金融业,以及由于财务状况或其他经营状况出现异常而被特别处理的企业,最终得到2907家企业,23450个观测样本。
二、模型与估计策略
参考现有的研究的做法,本研究构造多元回归模型,具体回归方程设定如模型(2-1)和模型(2-2)所示。模型(2-1)考察了地区宗族文化对企业数字化转型的直接影响,模型(2-2)从“政府持股”“境外投资者”的研究情境出发,考察了利益相关者对地区宗族文化对企业数字化转型的影响差异。具体变量定义如表2-1所示,文中分别控制了年份和行业等相关因素对于企业创新的影响,ε为随机扰动项。本研究按照1%与99%的水平对变量进行了缩尾处理(Winsorize),来控制异常值对模型分析的影响。
表2-1 变量定义
三、主要变量的描述统计
表2-2报告了主要变量的描述统计。样本企业所在地区的宗族文化的均值(标准差)为0.659(0.895),表明中国不同地区的宗族文化氛围显著不同,而样本企业数字化转型规模均值(标准差)为1.054(1.477),企业数字化转型强度均值(标准差)为1.139(3.086),表明企业数字化转型的差异程度很大。宗族文化分别与企业数字化的转型规模、转型强度负相关,表明不同地区宗族文化可能是企业数字化转型的一个抑制因素,为了验证二者之间的关系,本研究将通过控制其他变量因素和相关统计方法,进一步排除其他可能的替代文化治理已经成为国家治理体系和治理能力现代化的重要组成部分的解释。
表2-2 主要变量的描述统计