用于金融文本挖掘的多任务学习预训练金融语言模型

2022-05-21 20:09 696 浏览
论文tags: 金融论文范文

摘要近年来,机器学习,特别是深度神经网络方法,促进了金融文本挖掘研究的发展,在金融技术领域发挥着越来越重要的作用。如何从金融大数据中提取有价值的信息已成为学术界和工业界一项非常具有挑战性的研究。由于深度神经网络需要大量的数据标记,但金融领域缺乏培训数据,因此将深度学习应用于金融大数据挖掘并没有取得很好的效果。为了更好地解决这个问题,最新的思想和技术,如自我监督学习和多任务学习,F_BERT提出了基于BERT模型架构的开源金融预训练语言模型。F-BERT是一种针对特定领域(金融文本数据)的预训练语言模型,通过在大型金融语料库上进行非监督训练获得。基于BERT架构,F-BERT可以有效地自动从金融大数据中提取和记忆知识,而无需修改具体金融任务的模型结构,可以直接应用于下游金融领域的各种任务,包括股票涨跌预测、金融情绪分类、金融智能客户服务等。金融关系提取、金融情绪分类和金融智能问答任务中的大量实验表明,F-BERT模型的有效性和鲁棒性。F-BERT在这三篇具有代表性的金融文章中模型精度高,进一步验证了模型的性能。

关键词BERT;金融文本挖掘;多任务学习;预训练;迁移学习;金融科技。

大量的互联网金融信息在金融市场中起着重要的作用,对网络金融文本信息的挖掘具有很大的实用价值。随着大数据时代的到来,金融大数据挖掘已成为行业的热点趋势,金融机器学习技术吸引了越来越多的关注。面对惊人的金融文本数据,如何从中提取有价值的信息已成为学术界和工业界面临的一项非常具有挑战性的研究。如果我们手动分析这些文本信息,并获得可行的意见,这几乎是一项极其困难的任务。机器学习技术的进步使金融技术中的金融文本挖掘模型成为可能。然而,在金融文本挖掘任务中,建立监督培训数据的成本非常高,因为它需要使用金融领域的专家知识。由于F-BET模型不能用于金融文本挖掘任务的标签培训数据,因此大多数金融文本挖掘模型不能直接使用

通过使用自监督学习和多任务学习的深度神经网络来解决这个问题。目前,金融技术中的金融文本挖掘。

挖掘模型主要采用基于深度学习的自然语言处理技术。目前,自然语言处理主要采用基于深度神经网络的技术,其发展主要包括两个里程碑。首先,以word2vec[1]为代表的词向量技术于2013年提出并不断发展,如word2vec、glove[23等;第二个里程碑是谷歌在2018年底提出的。mtransformers)[3]作为典型代表的预训练语言模型(pre_traing1anguagemodels)技术,如BERT、ELMO[43等。其中,word2vec、Glove等词汇编码是从非监督语料库中提取知识的一种方式,已成为自然语言处理的主要进步之一。但是,由于金融领域有很多专业术语,这些简单的词向量方法是不够有效的。另一方面,预训练的语言模型技术,如BERT、ALBERT[53等。经过大规模的语言模型预训练,BERT获得了有效的上下文表示。与word2VEC词向量相比,BERT可以充分利用深度预训练模型的参数,更有效地学习上下文知识。然而,模型预训练(如BERT)主要使用基于简单预训练任务的语言模型进行训练,使模型具有掌握单词或句子共存的能力。事实上,除了共存之外,还有其他词汇、句法和语义信息需要在训练语料库中检查。特别是对于金融文本数据,如股票、债券类型和金融机构名称,命名实体包含唯一的词汇信息。例如,句子顺序和句子之间的接近度等信息也使模型能够学习语义感知表示。此外,BERT的预训练数据来自BOOKSCorpus和英语维基百科全书。这些语料库不一定类似于目标任务的语言环境,如金融领域。因此,如果我们直接使用BERT挖掘金融文本,效果不是很好。为了有效地捕获大型金融培训语料库中的语言知识和语义信息,我们建立了四项涵盖更多知识的自我监督学习预训练任务,并通过多任务学习培训数据培训F-BERT。具体来说,我们创新地提出了BERT模型,在模型架构中,我们建立了四项自我监督学习预培训任务,学习了金融领域的普通文本语料和文本语料,使FBERT能够更好地捕获金融文本数据的语言知识和知识。

综上所述,本文的主要贡献有五个方面:

1)利用深度学习领域的自我监督学习和多任务。

学习技术提出了基于BERT模型架构的大规模语料库训练的开源金融预训练模型F-BERT。2)建立了四项自监督学习预训练任务,可通过多任务自监督学习同时进行预训练。通过这种机制,我们可以有效地捕获大规模预训练语料库中的金融语言知识和语义信息。

3)金融任务实验分别在金融关系提取、金融情绪分类、金融智能问答任务等方面进行,验证了FBERT的有效性和鲁棒性。实验结果表明,F-BERT模型已经完成了这三项具有代表性的金融文本挖掘任务。

最佳准确性优于当前所有其他模型;此外,对于金融命名实体识别,实验验证了金融短文本分类的两项实际金融技术任务,提出的F-BERT模型具有最佳准确性。

4)采用混合精度训练方法,在Horovod框架上进行F-BERT分布式训练,不仅使整个训练过程具有稳定的加速比,而且具有良好的可扩展性。

5)F_BERT在Github上开源,包括其模型架构、源代码、超参数、训练模型和微调源代码。通过这个开源代码,F-BERT可以用于挖掘其他下游各种金融文本任务,最少修改特定的金融文本分析任务,帮助实现最新的性能。


论文tags: 金融论文范文
分享:
相关内容
  • 部分外包,安全外部性论文
    关键词: 部分外包;安全外部性;信息泄露;强制性安全标准;摘要: 信息技术的快速发展不仅方便了人们的生活,同时也给企业和个人带来了更大的安全隐患。为了应对安全风险的挑战,企业倾向于将部分信息安全外包给专业的管理安全服务提供商(MSSP),MSSP旨在通过专业高效的信息安全管理手段来帮助企业提高信息安全质量。因此,本文考虑了部分外包发生时企业和MSSP之间不对称的
  • 生物质燃料论文
    关键词: 生物质燃料;可持续性;可持续认证;摘要: 当前气候变化问题、能源问题严峻及“碳达峰碳中和”压力较大的背景下,生物质燃料的关注度不断提升。本文从产能、技术、可持续性等方面入手,深入分析了生物质燃料发展过程中存在的问题,指出当前主流可持续性认证体系中的评价指标、碳排放核算方法等同我国国情的不符之处,为加快构建我国特色的生物质燃料可持续性
  • 顾客欣喜,顾客契合行为论文
    关键词: 顾客欣喜;顾客契合行为;顾客承诺; 摘要: 围绕移动购物情境,本研究挖掘顾客欣喜对顾客契合行为的影响机理,并探索这一关系链中有中介的调节机制。研究发现顾客欣喜显著且正向影响契合行为,这一关系受到网上购买经验的负向调节作用和顾客承诺的中介作用,且交互项通过顾客承诺间接影响顾客契合行为。研究结果为移动商家长期维系顾客有一定的借鉴意义。1.
  • 冷链物流论文
    关键词: 冷链物流;配送车;车厢内部优化设计;生鲜产品;摘要: 随着生鲜电商销售行业的快速发展,小规模多品种冷藏配送频率越来越高。文章在基于快递配送车研究现状的基础上,对冷链物流末端配送车应用现状进行调研,目前冷链物流末端配送车应用方面存在车厢容积利用率低;冷链配送作业取货不方便且效率低;制冷效果受到频繁开关小车门的影响三个方面的问题。因此对
  • 个性化推荐类型论文
    关键词: 个性化推荐类型;购买意愿;感知信任;感知价值;消费者知识;摘要: 个性化推荐作为如今电商平台的一个基本功能,在消费者购买决策中扮演重要角色。本研究以SOR理论为基础,探讨基于内容和协同过滤两种个性化推荐类型对消费者购买决策的影响差异和内在机制。研究结果表明:个性化推荐类型对消费者感知信任、感知价值和购买意愿的影响具有显著差异,协同过滤的
相关推荐
  • 跨国公司企业并购的系统动力学研究—以奔驰并购克莱斯勒公司为例
    关键词: WOTS-UP分析;系统动力学;跨国公司;企业并购;业务建模;摘要: 全球竞争和技术的不断进步正在显著改变企业的格局及其内部报告要求。本文通过对戴姆勒–奔驰公司WOTS-UP分析之前因构型,识别出与该公司未来发展相关的关键因素,并制定适当的策略来预测未来的发展和评估公司适应或利用这些发展的能力,然后通过开发支持战略选择的相关系统,将奔驰、克莱斯勒公司合
热门内容
  • 党史党建论文题目105个
     1.习近平新时代中国特色社会主义思想创立的历史考察,党史·党建 2.习近平总书记关于党史、国史的重要论述研究,党史·党建 3.习近平总书记关于大力弘扬“红船精神”等革命精神的重要论述研究,党史·党建 4.习近平新时代中国特色社会主义思想中加强党的全面领导思想研究,党史·党建 5.习近平新时代中国特色社会主义思想中全面从严治党思想研究,党史·党
  • 数字经济论文好写题目推荐50个
    数字经济论文好写题目推荐50个1“双循环”新发展格局下产业链升级机遇、挑战和路径选择    2从数字经济看自由主义的局限性   3我国数字贸易发展策略研究    4卖空机制如何影响企业数字化转型——理论机制分析与实证检验    5数字巨头跨界扩张的竞争法挑战与应对    6数字经济下的杭州丝绸企业品牌营销转型升级研究   7数字时代推进共
  • 党史论文选题精选88个
    •1.习近平总书记关于中国共产党历史重要论述研究,党史·党建,2022•2.习近平总书记关于坚持唯物史观、正确党史观重要论述研究,党史·党建,2022•3.习近平总书记关于坚持和加强党的全面领导重要论述研究,党史·党建,2022•4.习近平总书记关于推进党的自我革命重要论述研究,党史·党建,2022•5.习近平总书记关于依规治党重要论述研究,党史·党建,2022•6.树立正确历史认知
  • A企业仓储中心拣货流程优化研究
    第1章绪论1.1研究背景和意义1.1.1研究背景随着互联网技术的覆盖范围越来越广,电子商务平台因依托于互联网也在不断迅猛发展中。自2013年起,我国已连续八年成为全球最大的网络零售市场。根据中国互联网信息中心(CNNIC)统计调查发布的第47次《中国互联网络发展状况统计报告》显示,2020年,我国网上零售额达到11.76万亿元,较2019年增长10.9%。截至2020年12月,我国网络购物用户规
  • 数字经济论文范文3千字
    数字经济论文范文---持续做优做大我国数字经济近些年,互联网技术、互联网大数据、云计算技术、人工智能技术、区块链技术等新技术加快自主创新,日益融进社会经济发展各行业整个过程,世界各国争相制订数据经济发展战略、颁布激励现行政策,数字经济的发展趋势速率之快、覆盖范围之广、危害水平之深史无前例,已经变成重新组合全世界因素資源、重构世界经济构造、更改
联系方式
  • 13384015218
  • 13384015218
  • 921006691@qq.com