当前位置:主页 > 教育论文 > 教育创新论文 >

面向学科的主题词库构建及其应用研究

发布时间:2017-09-17 07:31

  本文关键词:面向学科的主题词库构建及其应用研究


  更多相关文章: 主题词抽取 关系挖掘 主题词库 教育技术学 垂直搜索


【摘要】:主题词库就是经过规范化处理了的主题词及其之间的关系所构成的词典。主题词库包括两个部分:词库和关系库,词库用于存储主题词,关系库则用于存储主题词间的各种关系。主题词库是信息组织与检索的重要工具,其应用非常广泛:它可以解决方便、快速、科学的检索大量文献的问题;特定学科领域的主题词库可以用于构建针对具体学科领域的垂直搜索引擎;主题词库中描述的主题词之间的语义关系可以起到知识导航的作用;此外,主题词库也被应用到人工智能、云计算等相关领域中。 目前国内关于主题词库的研究也取得了一些成果,但是随着研究工作的深入,主题词库构建过程中出现了一些新的问题:现有的主题词库大都采用人工标注完成,费时费力;而且目前面向具体学科领域的主题词库构建的相关研究也很少;此外,现有主题词库中主题词之间的关系都是两两主题词间的直接关系,并没有挖掘主题词之间间接的隐性关系。因此,研究面向具体学科领域的主题词库构建工作意义重大。 本论文的主要工作是以教育技术学为例,构建面向特定学科领域的主题词库。论文的主要研究工作有: (1)介绍了国内外关于主题词库的研究现状以及与主题词相关的理论基础。 (2)改进并实现了主题词抽取的相关算法,提出了一种文档结构与统计相结合的主题词提取方法,并通过实验证明此方法在准确率、召回率等方面要优于传统的TFIDF方法。 (3)研究ISM算法将其运用在主题词隐性关系的挖掘上,实现了利用ISM算法挖掘主题词间隐性关系、形成主题词的层级关系图。 (4)利用主题词的抽取算法和隐性关系挖掘算法以教育技术学为例构建面向特定学科领域的主题词库并对其做了应用研究。 论文的特色之处在于改进了主题词抽取的相关算法,并且在主题词及其简单关系的基础上实现了主题词间隐性关系挖掘,形成主题词的层级关系图,这是以往任何主题词库构建工作都没有研究过的。最后,通过主题词及其关系挖掘算法构建了面向教育技术学的主题词库并对其做了应用研究。
【关键词】:主题词抽取 关系挖掘 主题词库 教育技术学 垂直搜索
【学位授予单位】:华中师范大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:G40-057
【目录】:
  • 摘要5-6
  • Abstract6-9
  • 1 绪论9-15
  • 1.1 研究背景及意义9
  • 1.2 研究现状9-12
  • 1.2.1 国外研究现状10-11
  • 1.2.2 国内研究现状11-12
  • 1.3 论文主要工作12-13
  • 1.4 论文的组织结构13-15
  • 2 主题词相关理论综述15-22
  • 2.1 主题词概述15-18
  • 2.1.1 相关概念的界定15-17
  • 2.1.2 概念间的比较17-18
  • 2.2 主题词间关系概述18-20
  • 2.3 主题词抽取原则20-21
  • 2.4 小结21-22
  • 3 主题词抽取及层级关系图的生成22-33
  • 3.1 文档结构与统计相结合的主题词提取22-25
  • 3.1.1 算法流程图22-23
  • 3.1.2 算法原理分析23-24
  • 3.1.3 试验结果及分析24-25
  • 3.2 主题词层次关系的自动生成算法研究25-31
  • 3.2.1 ISM法的三要素26-27
  • 3.2.2 基于ISM的主题词层级关系生成算法27-28
  • 3.2.3 算法的关键步骤28-29
  • 3.2.4 实验结果分析29-31
  • 3.3 小结31-33
  • 4 面向学科的主题词库的设计与实现33-48
  • 4.1 主题词库的体系结构设计33-35
  • 4.1.1 主题词库系统设计33
  • 4.1.2 主要工作流程33-35
  • 4.2 主要功能模块设计35
  • 4.2.1 文档预处理模块35
  • 4.2.2 主题词提取模块35
  • 4.2.3 关系挖掘模块35
  • 4.3 数据结构设计35-37
  • 4.3.1 索引库的设计35-36
  • 4.3.2 主题词库的设计36-37
  • 4.4 面向学科的主题词库构建37-47
  • 4.4.1 文档预处理模块的实现37-40
  • 4.4.2 主题词提取模块的实现40-42
  • 4.4.3 关系挖掘模块的实现42-47
  • 4.5 小结47-48
  • 5 面向学科的主题词库应用研究48-58
  • 5.1 主题词库应用研究48
  • 5.2 垂直搜索引擎总体架构48-50
  • 5.3 基于主题词库的垂直搜索引擎50-57
  • 5.3.1 体系结构设计50-52
  • 5.3.2 索引模块的设计与实现52-55
  • 5.3.3 结果分析55-57
  • 5.4 小结57-58
  • 6 总结与展望58-59
  • 6.1 研究总结58
  • 6.2 问题与展望58-59
  • 参考文献59-62
  • 项目资助及发表论文情况62-63
  • 致谢63

【引证文献】

中国硕士学位论文全文数据库 前1条

1 孙小欣;基于潜在语义分析的学科知识图谱构建[D];华中师范大学;2013年



本文编号:868081

资料下载
论文发表

本文链接:https://www.wllwen.com/jiaoyulunwen/jiaoyugaigechuangxinlunwen/868081.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户4d5b8***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com