当前位置:主页 > 社科论文 > 图书档案论文 >

学术文献被引片段识别与引用类型分类研究

发布时间:2024-05-07 02:18
  引文上下文中含有被引文献的重要信息,如研究方法、研究结论和研究不足等,已被广泛应用于自动摘要研究工作中。然而,由于引用动机的不同,不同的作者对被引文献的描述也存在较大差异,使得引文上下文难以全面准确地反应被引文献的内容。近几年来,多项测评比赛,如CL-Sci Summ Shared Task、TAC 2014(国际文本分析会议)等均提出了基于科技文献中的被引片段的结构化摘要生成方法。被引片段是指引文上下文或者引用对象在被引文献中所对应的内容,其取自被引文献本身,相比于使用引文上下文生成摘要的方法,该方法所生成的摘要能够准确有效地反应被引文献的内容。在基于被引片段的结构化摘要生成框架中,需要根据引文上下文识别出被引文献中的被引片段,然后根据引文上下文与被引片段之间的引用类型对其进行分类并压缩整理,得到被引文献的结构化摘要。被引片段的识别与分类效果直接影响到所生成结构化摘要的质量,因此,本文主要针对被引片段的自动识别和引用类型的分类展开研究。被引片段的自动识别研究包括以下两部分:非均衡数据集的处理和被引片段识别模型的构建。本文将被引片段的自动识别问题视为二元分类问题,由于在训练集中存在着较...

【文章页数】:122 页

【学位级别】:硕士

【部分图文】:

学术文献被引片段识别与引用类型分类研究



硕士学位论文学术文献被引片段识别与引用类型分类研究7图1.2研究框架图(1)非均衡数据集问题处理与现有的大部分研究工作类似,本文将被引片段的自动识别研究视为在被引文献中寻找与引文句最相似的句子,并将该问题转化为对文献中每个句子做二元分类的过程,该问题解决思路将会导致训练数据集中不....


学术文献被引片段识别与引用类型分类研究



硕士学位论文学术文献被引片段识别与引用类型分类研究25本文将使用机器学习分类算法来进行被引片段的识别研究,具体采用二元分类来解决,即对被引文献中所有候选句子的识别结果只有两种:被引片段(类别为“1”)和非被引片段(类别为“0”)。此外,对于每个候选句子,本文将依据下文所介绍的特征....


学术文献被引片段识别与引用类型分类研究



3被引片段自动识别中非均衡数据问题研究硕士学位论文26fulltextSidSentence_position=sentence_number(公式3.2)④Section(sec)Section表示候选被引片段所在段落在全文段落中的序号,该信息同样由CL-SciSumm2018....


学术文献被引片段识别与引用类型分类研究



4被引片段自动识别模型构建硕士学位论文444.2.2LogisticRegression分类模型逻辑斯蒂回归(LogisticRegression)又叫对数几率回归,是一种二元分类模型而非回归模型,但又与回归模型密切相关,采用了多元线性回归的思路来解决分类问题[127]。同样是给....



本文编号:3966677

资料下载
论文发表

本文链接:https://www.wllwen.com/tushudanganlunwen/3966677.html


Copyright(c)文论论文网All Rights Reserved | 网站地图

版权申明:资料由用户270c3***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱[email protected]