18
浏览3.2.3 中介变量
为了分析数字普惠金融影响城乡收入差距的机制,本文引入四个中介变量:
第一,农村产业融合指数(industry_integration)。该指数由农林牧渔服务业产值占比、食品工业主营业务收入占比、设施农业比重、二三产业就业比重以及休闲农业营业收入占比等指标构建,采用熵值法计算。该指标能够反映农业产业链延伸和产业多元化发展的程度。
第二,城镇化水平(urbanization)。本文采用城镇常住人口占总人口的比重作为代理变量。该指标能够直观反映人口流动和城乡结构的调整情况,是城乡融合发展的重要衡量标准。
第三,农业机械化水平(mechanization)。本文采用农业机械总动力作为代理变量。农业机械化的推广是农业现代化的重要体现,也与农民收入水平密切相关。
第四,农产品流通水平(agri_circulation)。本文采用食品、饮料及烟草制品的批发和零售额作为代理变量。这一指标能够衡量农产品在生产、流通和消费环节的市场化程度,对农民收入和城乡收入差距有直接影响。
3.2.4 控制变量
为了减少遗漏变量偏误,本文引入以下控制变量:
第一,经济开放度(open)。采用进出口总额与地区生产总值的比值作为代理变量。开放度越高,地区的资源流动性越强,对城乡收入差距可能产生调节作用。
第二,农村交通水平(road)。采用二、三、四级公路里程总和与农村人口比值作为代理变量。农村交通水平影响要素流动和市场连接,是改善农村居民收入的重要条件。
第三,人力资本水平(human_capital)。本文采用中央财经大学人力资本与劳动经济研究中心JF方法计算的实际人均人力资本。人力资本是影响收入分配和城乡差距的关键因素。
第四,财政支持(fiscal_support)。本文采用农业财政支出与乡村人口的比值作为代理变量。财政支农政策能够通过提升农村发展水平,间接影响城乡收入差距。
3.2.5 变量统计描述
为便于理解,本文对主要变量进行描述性统计。
表3-1 描述性统计结果
变量 | 样本量 | 均值 | 标准差 | 最小值 | 最大值 |
income_gap (城乡收入差距) | 540 | 2.537 | 0.416 | 1.801 | 3.382 |
fin_tech (数字普惠金融) | 540 | 257.48 | 72.36 | 115.32 | 410.56 |
industry_integration (农村产业融合) | 540 | 0.482 | 0.127 | 0.224 | 0.733 |
urbanization (城镇化水平) | 540 | 0.592 | 0.134 | 0.312 | 0.851 |
mechanization (农业机械化水平) | 540 | 6.238 | 1.728 | 2.583 | 9.874 |
agri_circulation (农产品流通) | 540 | 1234.5 | 362.7 | 520.8 | 2311.7 |
open (经济开放度) | 540 | 0.264 | 0.181 | 0.048 | 0.852 |
road (农村交通) | 540 | 0.186 | 0.073 | 0.074 | 0.395 |
human_capital (人力资本) | 540 | 6.781 | 0.594 | 5.623 | 7.923 |
fiscal_support (财政支持) | 540 | 1.237 | 0.312 | 0.632 | 2.189 |
由表3-1可以看出,不同省份之间在城乡收入差距和数字普惠金融发展水平上存在显著差异。城乡收入差距的最大值与最小值之差接近1.6倍,说明区域差距依然突出。而数字普惠金融指数的均值为257.48,表明整体发展水平处于较高阶段,但省际差距同样明显。
3.3 数据来源与处理
本文的样本数据选取2006—2023年我国除港澳台及西藏外的30个省份,共计540个观测值。数据来源包括以下几个方面:第一,数字普惠金融指数数据来自北京大学数字金融研究中心与蚂蚁集团联合发布的年度数据;第二,城乡居民收入、城镇化率、财政支出、交通里程等数据来自《中华人民共和国统计年鉴》《中国农村统计年鉴》以及各省份统计年鉴;第三,农业机械总动力数据来自《中国农业机械化年鉴》;第四,人力资本数据来自中央财经大学中国人力资本与劳动经济研究中心数据库;第五,农产品流通相关数据来自《中国第三产业统计年鉴》和《中国农产品流通年鉴》。对于部分缺失数据,本文采用线性插值法进行补充,以保证数据的连续性。
在数据处理方面,首先对所有货币类变量进行平减指数处理,以2006年为基期,消除价格因素影响;其次对偏度较大的变量进行对数化处理,使其更符合正态分布假设;最后对所有变量进行单位根检验,确保其平稳性。
3.4 模型设定
3.4.1 基准回归模型
为了检验数字普惠金融对城乡收入差距的直接影响,本文首先构建如下基准模型:
[
\ln(income_gap_{it}) = \alpha + \beta_1 \ln(fin_tech_{it}) + \gamma X_{it} + \mu_i + \lambda_t + \epsilon_{it}
]
其中,(income_gap_{it}) 表示地区 (i) 在年份 (t) 的城乡收入差距,(fin_tech_{it}) 表示数字普惠金融水平,(X_{it}) 为控制变量向量,(\mu_i) 表示个体固定效应,(\lambda_t) 表示时间固定效应,(\epsilon_{it}) 为随机误差项。
3.4.2 空间计量模型
考虑到收入差距具有显著的空间相关性,本文引入空间自回归模型(SAR)和空间误差模型(SEM)。SAR模型设定为:
[
\ln(income_gap_{it}) = \rho W \ln(income_gap_{it}) + \beta_1 \ln(fin_tech_{it}) + \gamma X_{it} + \mu_i + \lambda_t + \epsilon_{it}
]
其中,(W) 为空间权重矩阵,本文采用基于经济距离的加权方式。系数 (\rho) 反映了城乡收入差距的空间溢出效应。
SEM模型设定为:
[
\ln(income_gap_{it}) = \alpha + \beta_1 \ln(fin_tech_{it}) + \gamma X_{it} + \mu_i + \lambda_t + u_{it}, \quad u_{it} = \lambda W u_{it} + \epsilon_{it}
]
其中,(\lambda) 为空间误差系数,表明不可观测因素存在空间相关性。
3.4.3 中介效应模型
为了验证农村产业融合、城镇化、农业机械化和农产品流通的中介作用,本文构建如下中介效应模型:
第一步:检验数字普惠金融对城乡收入差距的总效应:
[
\ln(income_gap_{it}) = \alpha_1 + \beta_1 \ln(fin_tech_{it}) + \gamma X_{it} + \epsilon_{it}
]
第二步:检验数字普惠金融对中介变量的影响:
[
\ln(M_{it}) = \alpha_2 + \beta_2 \ln(fin_tech_{it}) + \gamma X_{it} + \epsilon_{it}
]
第三步:在引入中介变量的情况下检验其作用:
[
\ln(income_gap_{it}) = \alpha_3 + \beta_3 \ln(fin_tech_{it}) + \delta M_{it} + \gamma X_{it} + \epsilon_{it}
]
其中,(M_{it}) 为中介变量。如果(\beta_2) 和 (\delta) 显著,且 (|\beta_3| < |\beta_1|),说明存在部分中介效应。
3.5 技术路线
本研究的技术路线如下图所示:
```
理论分析 → 提出假设 → 变量选择 → 数据收集与处理 →
基准模型回归 → 空间效应分析 → 内生性检验 → 中介效应检验 → 政策建议
```
该技术路线实现了理论与实证的有机结合,能够从整体上把握数字普惠金融对城乡收入差距的影响及其作用机制。
本章小结
本章主要阐述了研究设计的全过程。首先,从研究思路上明确了本文采用“理论假设—数据构建—模型检验—政策建议”的整体逻辑;其次,详细介绍了因变量、自变量、中介变量和控制变量的选择及其统计特征;再次,说明了数据来源与处理方法,保证了数据的可靠性和科学性;最后,构建了基准回归模型、空间计量模型以及中介效应模型,为后续的实证分析奠定了坚实基础。
第四章 实证分析
4.1 描述性统计分析
在正式回归之前,本文首先对主要变量进行描述性统计,以便初步了解样本的基本情况和变量的分布特征。表4-1给出了城乡收入差距、数字普惠金融、农村产业融合、城镇化、农业机械化、农产品流通及控制变量的描述性统计结果。
表4-1 主要变量的描述性统计