359
浏览2. 贷款结构差异
如果某家银行更倾向发放短期贷款或信用贷款,这在一定程度上反映了其信贷结构中信息不对称更为严重。
短期贷款往往体现出银行对借款企业的谨慎:一旦长期信息难以掌握,银行只能选择短期滚动续贷,以降低风险敞口。信用贷款则意味着无抵押、无质押,对客户资质要求更高,也更需掌握全面而精准的信息。
如果金融科技能大幅提升对企业真实经营状况的掌握,则在短期贷款占比高或信用贷款占比高的银行中,会有更明显的利好,从而更强地降低不良贷款率。
基于上述,本文提出假说3a(对规模小银行的影响更大),假说3b(短期贷款比重越高,则金融科技“减风险”效应越大)和假说3c(信用贷款比重越高,则金融科技“减风险”效应越大)。
四、与现有研究的互补
已有文献对数字金融与银行风险进行了不少探讨,但大多聚焦区域宏观层面,或采用笼统的“互联网金融发展指数”。相较之下,本文着眼于银行个体层面,更能捕捉到微观差异。并且结合中介效应分析,为金融科技的具体传导路径提供了较为严格的实证支持。由此,在理论与实践层面都有进一步的推进价值。
第三部分:数据与模型设计
在本部分,将详细阐述论文中使用的数据来源和处理方式,并对具体的计量方法进行说明,确保对读者而言具备可操作性与可检验性。
一、数据说明与主要来源
1. 时间跨度
本文选取2013—2018年作为研究区间。之所以选择这一区间:
其一,2013年之后,国内金融科技浪潮开始加速,包括多家银行开始发力互联网金融服务与大数据风控;
其二,样本数据在此期间相对齐全,银行年报通常都能提供不良贷款、存贷比以及部分贷款结构信息;
其三,为配合深圳迪博内部控制指数的可得性,考虑到数据一致性也适合在此期间开展研究。
2. 银行样本
本研究涵盖了208家银行(包括国有行、全国性股份制行、城市商业银行以及部分农村商业银行),形成一个典型的非平衡面板数据集。之所以非平衡,是因为部分银行在某些年份并未披露完整数据或者样本期内才成立或被收购导致信息缺失。
3. 宏观与银行层面数据
宏观层面:上证综合指数(用其年度收盘价的对数值表示),全社会固定资产投资增速等数据来自国家统计局。
银行层面:不良贷款率、贷款总额、运营成本、非利息收入占比、财务杠杆率、资产规模等主要来自Bankscope数据库和各行年报。
在涉及贷款结构的研究时,需要获取短期贷款占比、信用贷款占比的资料,主要依赖于公开披露的财报。有些银行年报只披露部分信息,故该子样本会相对更少。
4. 内部控制指数(ic)
本文使用“深圳迪博内部控制指数”作为衡量银行内部控制质量的主要指标。由于该指数目前主要覆盖上市银行,因此在使用它进行中介效应分析时,样本银行会缩减至16家(国有大行与上市的股份制行)。
5. 金融科技运用(fintech)
本文关键的创新度量。首先确定了五大关键词:大数据、云计算、人工智能、区块链、物联网;然后针对每家银行名称与这些关键词的组合,利用网络爬虫抓取相关信息记录数量。
将五类技术的检索记录作为基础指标,再使用主成分分析来做加权,得到最终的综合性金融科技运用指数“fintech”。数值越高,表示该银行对五项金融科技的应用愈发广泛、密集。
作者在文中通常会附上一张表(如“表1 主要变量定义”)来列示各变量的具体含义及计量方式。下文同样基于这样的表格结构进行扼要总结:
被解释变量(因变量)
不良贷款率(npl):不良贷款总额 / 贷款总额,以百分比形式
风险加权资产占比(risk):风险加权资产 / 总贷款,在稳健性检验中替代npl
核心自变量
金融科技运用(fintech):运用网络爬虫与主成分分析得到的指数
中介变量
内部控制(ic):深圳迪博内部控制指数
贷款结构变量(调节项)
短期贷款比重(sloans):短期贷款 / 总贷款
信用贷款比重(loans):信用贷款 / 总贷款
控制变量
上证综指(sp):上证指数年末值取对数
全社会固定资产投资增速(fixg):以百分比表示
银行规模(asset):以银行总资产计,单位百亿元
存贷比(dlr):贷款 / 存款
非利息收入占比(nir):非利息收入 / 营业收入
运营成本(oc):运营成本 / 总资产
财务杠杆率(flr):息税前利润 / 营业利润
二、模型设定
1. 基准回归模型:考察金融科技与不良贷款率
为检验“金融科技运用是否能降低商业银行不良贷款率”,最核心的回归形式可以写成(用文字描述):
npl = α0 + α1 × fintech + α2 × X + 银行个体固定效应 + 时间固定效应 + 误差项
其中,npl 表示不良贷款率,fintech 表示金融科技运用指数,X 表示一系列控制变量(包括宏观和银行层面)。为了克服面板数据的潜在遗漏偏误,我们同时考虑了个体固定效应和时间固定效应。有时,还会用系统GMM方法来处理可能的内生性问题。
2. 中介效应模型:内部控制视角
若金融科技可以通过内部控制(ic)这一中介传导来影响 npl,则可以分步骤进行:
第一步:npl = β0 + β1 × fintech + …
第二步:ic = γ0 + γ1 × fintech + …
第三步:npl = θ0 + θ1 × fintech + θ2 × ic + …
如果在这三步回归中,fintech、ic 等系数都表现显著,且在第三步回归中 ic 仍对 npl 有显著影响,就说明存在中介效应。作者也通过Sobel检验等进一步验证了中介的显著性。
3. 门槛模型:规模差异的异质性
为了考察不同规模的银行在“金融科技与不良贷款率”之间是否存在阈值差异,论文采用动态面板门槛模型的思路,用银行资产规模(asset)作为门槛变量。简单来说,假定存在一个阈值 ω,把样本银行分成 asset ≤ ω 和 asset > ω 两组,对应金融科技的影响系数也可能不同。
具体形式可以写为:
npl = θ1 × fintech × I(asset ≤ ω) + θ2 × fintech × I(asset > ω) + 其他控制项
其中 I(·)为示性函数,满足条件则取1,否则取0。估计时,可使用Hansen风格的门槛检验来确定 ω。
4. 交互项:贷款结构差异的异质性
由于数据方面的限制(部分贷款结构信息缺失较严重),在考察贷款结构时,作者更多地使用“fintech×loans”或“fintech×sloans”的交互项来衡量差异。即在回归中加入:
npl = β0 + β1 × fintech + β2 × (fintech × loans) + …
或
npl = β0 + β1 × fintech + β2 × (fintech × sloans) + …
若交互项系数显著为负,表明当信用贷款比重/短期贷款比重越大时,金融科技对不良贷款率的缓释效应越强。
三、描述性统计与相关性分析
论文中一般还会呈现一张描述性统计表(如表2),列示每个变量的均值、中位数、最大值、最小值、标准差等。可大致看出:
不良贷款率在不同银行间差距较大,某些中小银行的 npl 会远高于大行;
金融科技运用指数 fintech 的分布情况也有明显差异,不少中小行的爬虫记录近似为 0,而大行或部分技术领先的股份行则远高于均值;
信用贷款与短期贷款的占比也不尽相同,极端案例中,短期贷款接近了 99%,显示其贷款结构非常谨慎且集中在短期;
资产规模差异更是悬殊:国有大行可能达到几十万亿级别的总资产,而一些地方性农商行则只有百亿左右。
在后续回归时,这些差异既是变量本身的体现,也成为检验金融科技效用异质性的依据。
第四部分:实证结果与分析
本文最核心的回归和检验都集中在这一部分。研究者通常会给出若干回归结果表,分别讨论基准结果、中介效应结果,以及分组与交互项分析。下文将综合呈现这些发现,并分条说明。
一、基准回归:金融科技与不良贷款率
1. 混合回归、固定效应与系统GMM的比较
在最初阶段,作者使用了普通最小二乘(OLS)的混合回归以及固定效应模型,对 fintech 与 npl 的关系进行简单检验。结果表明,fintech 变量的估计系数一般为负,且在不同程度上达到显著水平。为更严谨地应对内生性,随后采用系统GMM(SYS-GMM)做进一步回归,并利用 AR(2)、Sargan 检验来评估工具变量的有效性。