命名实体识别论文提纲,命名实体论文提纲

2022-11-10 14:48 506 浏览

面向通信领域术语的命名实体识别


摘要:命名实体识别技术是自然语言处理中的一项基础技术,为其他任务提供重要的基础信息保障。本文所研究的通信领域具有知识专业性高、术语庞杂丰富、细分领域多样等特点,却缺乏必要的高质量实体列表和语料库,上述情况严重制约了该领域命名实体识别任务的开展。同时,虽然命名实体识别技术在常规领域已经取得了良好的效果,但当其应用于通信这种专业性强的领域时,往往会出现很多的适应性问题。目前,针对通信领域进行的命名实体识别研究甚少,随着通信技术的蓬勃发展,准确、高效的从通信领域专业文献中提取命名实体,是支撑自然语言技术在该领域深化应用的基础,对其他专业领域应用此项技术也具有较高价值的借鉴意义。本文围绕通信领域中文命名实体抽取任务展开,结合背景项目提供的资料,补充了中国通信标准化协会在《通信词典检索系统》中定义的术语,及从知网爬取的通信专业文献摘要的语料。本文对通信领域命名实体的特点进行了分析,提出了该领域嵌套命名实体构成的基本假设。然后基于此假设,重点研究了词典构建中的词汇领域性判别问题和特征选择中的字/词维度适配问题,提出了基于隐性迪利克雷分布(Latent Dirichlet Allocation,LDA)模型的词汇领域性判别方法,以及基于双层条件随机场(Conditional Random Field,CRF)模型的通信特征提取方法。随后,选择了若干通信领域特征,以长短期记忆网络(Long Short-Term Memory,LSTM)模型为基础,利用前置CRF层将领域知识映射进输入特征,构建了面向通信领域术语特点的命名实体识别模型。最后,对设计的特征进行了叠加测试,对识别的效果进行了对比测试,验证了所选领域性特征的有效性,以及所设计模型对通信领域的适用性。本文的成果已经应用于某企业通信知识图谱的构建工作中,为准确提取对象本体的标称量提供了重要基础技术支撑。同时,本文的成果对其他类似专业领域的命名实体识别研究也有重要的借鉴参考意义。 

关键词:命名实体识别;命名实体;


文章目录

摘要

Abstract

第1章 绪论

    1.1 研究背景与意义

    1.2 命名实体识别技术的研究现状

    1.3 本文主要研究内容

第2章 通信领域中命名实体的特点分析

    2.1 中文命名实体识别的特点

    2.2 通信领域命名实体和语料的获取

        2.2.1 命名实体的获取

        2.2.2 通信语料的获取

    2.3 通信领域命名实体特点分析

    2.4 对通信命名实体构成的假设

    2.5 本章小结

第3章 通信基础词典的构建

    3.1 命名实体识别中词典的作用

    3.2 通信基础词典的内容设计

    3.3 核心短实体的提取

    3.4 限定词的提取

    3.5 基于LDA的领域限定词提取

        3.5.1 领域限定词

        3.5.2 基于LDA的领域限定词提取

        3.5.3 模型与结果分析

    3.6 本章小结

第4章 基于BiLSTM-CRF的通信命名实体识别

    4.1 通信领域命名实体识别方法

    4.2 基于CRF方法的领域特征选择

        4.2.1 常规CRF方法的领域适用性分析

        4.2.2 双层CRF结构的通信命名实体识别

        4.2.3 带有通信领域特色的特征选择与模板设计

        4.2.4 双层CRF结构的可行性和不足之处

    4.3 基于BiLSTM-CRF模型的通信命名实体识别

        4.3.1 BiLSTM-CRF模型原理与领域适用性分析

        4.3.2 面向BiLSTM-CRF的特征向量

        4.3.3 CRF-BiLSTM-CRF识别模型

    4.4 本章小结

第5章 特征有效性验证及识别模型效果分析

    5.1 命名实体识别的评价指标

    5.2 基于双层CRF的特征有效性验证试验

        5.2.1 实验设置

        5.2.2 实验结果

        5.2.3 实验分析

    5.3 CRF-BiLSTM-CRF模型识别效果验证试验

        5.3.1 实验设置

        5.3.2 实验结果

        5.3.3 实验分析

    5.4 本章小结

第6章 结论与展望

    6.1 结论

    6.2 展望

参考文献


[1]基于LSTM-CRF的中医医案症状术语识别[J]. 李明浩,刘忠,姚远哲.  计算机应用. 2018(S2)

[2]命名实体识别方法研究进展[J]. 黄晴雁,牟永敏.  现代计算机(专业版). 2018(35)

[3]基于条件随机场和篇章校对的有机物命名实体识别方法研究[J]. 谷威,田欣.  情报工程. 2018(05)

[4]基于罪名相关成分标注的刑事裁判文书概要信息提取[J]. 刘晨玥,李兵,吴卫星.  山东科技大学学报(自然科学版). 2018(04)

[5]基于深度学习的渔业领域命名实体识别[J]. 孙娟娟,于红,冯艳红,彭松,程名,卢晓黎,董婉婷,崔榛.  大连海洋大学学报. 2018(02)

[6]工业4.0术语体系研究[J]. 岳磊,闫晓风,牛鹏飞.  标准科学. 2018(04)

[7]命名实体识别研究综述[J]. 刘浏,王东波.  情报学报. 2018(03)

[8]潜在狄利克雷分布模型研究综述[J]. 何伟林,谢红玲,奉国和.  信息资源管理学报. 2018(01)

[9]基于CNN-BLSTM-CRF模型的生物医学命名实体识别[J]. 李丽双,郭元凯.  中文信息学报. 2018(01)

[10]中文分词算法及改进研究[J]. 申琳.  电脑知识与技术. 2017(31)


相关内容
  • 眼图论文提纲,串行通信论文提纲
    眼图测试在串行通信系统中的应用研究摘要:串行通信技术是目前数据通信采用的主要方式,但由于传输过程中噪声等因素的影响,串行信号可能会出现码间干扰,信号畸变等问题。日益增长的传输速率使噪声和抖动对信号质量的影响更加突出,如何保证通信的可靠性愈加重要。眼图作为一种直观、快速地分析串行信号质量的方法,可以衡量通信系统性能的优劣。通过眼图测试方法分析串行
  • 模块化多电平换流器论文提纲
    模块化多电平换流器(MMC)通用平台设计与研究摘要:模块化多电平换流器(modular multilevel converter,MMC)具有运行效率高、输出特性好、可拓展性强等优点,在柔性直流输电领域得到了广泛应用。本文针对现有MMC工程样机存在通用性不足的缺点,研制了一台以T型全桥子模块为基本拓扑的25电平MMC实验平台,并针对实际工程中子模块等效测试的需求,提出了一种MMC子模块运行工况等效试验方案
  • 双二进制信号论文提纲
    基于双二进制信号的高速串行通信接收电路设计摘要:随着大数据及5G通信时代的到来,人们对更高效、更安全的数据传输的需求不断增加。先进的半导体工艺及电路结构可大幅提高SerDes收发机的信号处理速率,而高速串行通信链路之间的有限带宽信道成为制约数据传输速率的瓶颈。因此,多电平信号技术相对于NRZ信号对带宽需求较小的优势被展现出来。其中,双二进制信号(duo-binary,DB)
  • 高速串行通信论文提纲
    高速串行通信链路扩频时钟发生器关键技术研究摘要:为了满足人们日益增长的数据传输需求,高速串行通信(SerDes)以其成本低、抗干扰能力强等优势受到广泛关注。扩频时钟发生器是链路中重要的模块,其抖动对系统的误码率至关重要,尤其是使用有效抑制电磁干扰的扩频技术带来的额外抖动。以高稳定性、高可靠性和低功耗、低抖动实现扩频时钟是高速SerDes中待解决的问题之一。本
  • 加密算法论文提纲
    基于AES算法的加密UART IP核设计与实现摘要:在当今信息化时代,信息安全问题已然成为不容忽视的严峻问题。信息加密作为保障信息安全的核心技术,在保障数据通信安全中占据着重要的地位。目前信息加密的实现方式主要有软件和硬件两种,而软件实现方式在执行效率上无法满足人们对信息安全的需求。因此开展串行通信接口的硬件加密研究对保障信息安全有着重要的现实意义。本论
相关推荐
  • 眼图论文提纲,串行通信论文提纲
    眼图测试在串行通信系统中的应用研究摘要:串行通信技术是目前数据通信采用的主要方式,但由于传输过程中噪声等因素的影响,串行信号可能会出现码间干扰,信号畸变等问题。日益增长的传输速率使噪声和抖动对信号质量的影响更加突出,如何保证通信的可靠性愈加重要。眼图作为一种直观、快速地分析串行信号质量的方法,可以衡量通信系统性能的优劣。通过眼图测试方法分析串行
  • 模块化多电平换流器论文提纲
    模块化多电平换流器(MMC)通用平台设计与研究摘要:模块化多电平换流器(modular multilevel converter,MMC)具有运行效率高、输出特性好、可拓展性强等优点,在柔性直流输电领域得到了广泛应用。本文针对现有MMC工程样机存在通用性不足的缺点,研制了一台以T型全桥子模块为基本拓扑的25电平MMC实验平台,并针对实际工程中子模块等效测试的需求,提出了一种MMC子模块运行工况等效试验方案
  • 双二进制信号论文提纲
    基于双二进制信号的高速串行通信接收电路设计摘要:随着大数据及5G通信时代的到来,人们对更高效、更安全的数据传输的需求不断增加。先进的半导体工艺及电路结构可大幅提高SerDes收发机的信号处理速率,而高速串行通信链路之间的有限带宽信道成为制约数据传输速率的瓶颈。因此,多电平信号技术相对于NRZ信号对带宽需求较小的优势被展现出来。其中,双二进制信号(duo-binary,DB)
  • 高速串行通信论文提纲
    高速串行通信链路扩频时钟发生器关键技术研究摘要:为了满足人们日益增长的数据传输需求,高速串行通信(SerDes)以其成本低、抗干扰能力强等优势受到广泛关注。扩频时钟发生器是链路中重要的模块,其抖动对系统的误码率至关重要,尤其是使用有效抑制电磁干扰的扩频技术带来的额外抖动。以高稳定性、高可靠性和低功耗、低抖动实现扩频时钟是高速SerDes中待解决的问题之一。本
  • 加密算法论文提纲
    基于AES算法的加密UART IP核设计与实现摘要:在当今信息化时代,信息安全问题已然成为不容忽视的严峻问题。信息加密作为保障信息安全的核心技术,在保障数据通信安全中占据着重要的地位。目前信息加密的实现方式主要有软件和硬件两种,而软件实现方式在执行效率上无法满足人们对信息安全的需求。因此开展串行通信接口的硬件加密研究对保障信息安全有着重要的现实意义。本论
热门内容
  • 党史党建论文题目105个
     1.习近平新时代中国特色社会主义思想创立的历史考察,党史·党建 2.习近平总书记关于党史、国史的重要论述研究,党史·党建 3.习近平总书记关于大力弘扬“红船精神”等革命精神的重要论述研究,党史·党建 4.习近平新时代中国特色社会主义思想中加强党的全面领导思想研究,党史·党建 5.习近平新时代中国特色社会主义思想中全面从严治党思想研究,党史·党
  • 数字经济论文好写题目推荐50个
    数字经济论文好写题目推荐50个1“双循环”新发展格局下产业链升级机遇、挑战和路径选择    2从数字经济看自由主义的局限性   3我国数字贸易发展策略研究    4卖空机制如何影响企业数字化转型——理论机制分析与实证检验    5数字巨头跨界扩张的竞争法挑战与应对    6数字经济下的杭州丝绸企业品牌营销转型升级研究   7数字时代推进共
  • 党史论文选题精选88个
    •1.习近平总书记关于中国共产党历史重要论述研究,党史·党建,2022•2.习近平总书记关于坚持唯物史观、正确党史观重要论述研究,党史·党建,2022•3.习近平总书记关于坚持和加强党的全面领导重要论述研究,党史·党建,2022•4.习近平总书记关于推进党的自我革命重要论述研究,党史·党建,2022•5.习近平总书记关于依规治党重要论述研究,党史·党建,2022•6.树立正确历史认知
  • A企业仓储中心拣货流程优化研究
    第1章绪论1.1研究背景和意义1.1.1研究背景随着互联网技术的覆盖范围越来越广,电子商务平台因依托于互联网也在不断迅猛发展中。自2013年起,我国已连续八年成为全球最大的网络零售市场。根据中国互联网信息中心(CNNIC)统计调查发布的第47次《中国互联网络发展状况统计报告》显示,2020年,我国网上零售额达到11.76万亿元,较2019年增长10.9%。截至2020年12月,我国网络购物用户规
  • 怎么写党的二十大论文题目
    写党的二十大论文题目时,可以从以下几个方面入手:1. 新时代中国特色社会主义的发展与实践:以党的二十大为背景,分析我国在经济、政治、文化、社会等方面的发展成就和存在的问题,探讨如何进一步推进中国特色社会主义事业。2. 党的建设新的伟大工程:以党的二十大精神为指导,研究如何加强党的领导、改进党的作风、加强党同人民群众的联系,推动全面从严治党向纵深发
联系方式
  • 13384015218
  • 13384015218
  • 921006691@qq.com