当前位置:主页 > 论文百科 > 学位论文 >

基于特征及规则模式的学位论文元数据信息自动抽取研究

发布时间:2017-05-15 12:14

  本文关键词:基于特征及规则模式的学位论文元数据信息自动抽取研究?,由笔耕文化传播整理发布。


【摘要】:目前,在中国高校数字图书馆,学位论文数据库是重要的数字资源,然而,其元数据录入一直依赖手工完成,效率低,耗费大量的人力。针对这一问题,采用基于文档特征与规则模式匹配的方法,利用正则表达式研究学位论文元数据的自动抽取,该算法包括信息定位和元数据抽取两个模块。实验数据表明,该算法具有较高的准确率和召回率以及综合性能指数F。
【作者单位】: 燕山大学图书馆;
【关键词】学位论文 元数据 信息抽取 正则表达式 模式匹配
【分类号】:G250.7
【正文快照】: 目前,在中国高校数字图书馆系统中,研究生学位论文数据库作为重要的数字资源,为高校师生检索提供了很大的便利。对学位论文的检索依赖于元数据信息,元数据是用于描述数据的特征和属性的数据,也是组织、发现信息资源的工具,确保数字化信息能够被计算机及其网络系统识别、分解、

【参考文献】

中国期刊全文数据库 前4条

1 李胜利;李昌清;袁平鹏;刘英书;;基于Web的电子期刊元数据信息抽取方法[J];华中科技大学学报(自然科学版);2007年12期

2 李朝光,张铭,邓志鸿,杨冬青,唐世渭;论文元数据信息的自动抽取[J];计算机工程与应用;2002年21期

3 曹俊;万晓云;廖顺宝;;基于正则表达式批量提取CNKI文献元数据技术探究[J];图书情报工作;2010年19期

4 钱建立;吴广茂;蒋路;;基于特征相似度的科技论文元数据提取算法研究[J];微电子学与计算机;2008年08期

【共引文献】

中国期刊全文数据库 前10条

1 高良才;汤帜;陶欣;房婧;;一种自动发现、分割与标注引文元数据的方法[J];北京大学学报(自然科学版);2010年06期

2 张丽娜;陈俊杰;赵丽欣;;基于HTMLParser的BT种子网页信息抽取[J];电脑开发与应用;2010年03期

3 李小斌;;一种从HTML页面到RDF文档的转化方法[J];电脑与信息技术;2006年04期

4 黄光芳;;正则表达式在远程网页下载中的应用[J];电脑知识与技术(学术交流);2007年12期

5 欧阳辉;禄乐滨;;基于证据理论的论文元数据抽取算法研究[J];电子设计工程;2010年04期

6 欧阳辉;禄乐滨;;基于SVM的论文元数据抽取方法研究[J];电子设计工程;2010年05期

7 钱爱兵;;期刊论文元数据自动抽取系统的设计与实现[J];计算机光盘软件与应用;2014年21期

8 舒秦;;气象报表天气现象的分析与统计[J];电脑编程技巧与维护;2015年04期

9 郭志鑫;金海;陈汉华;;SemreX中基于语义的文档参考文献元数据信息提取[J];计算机研究与发展;2006年08期

10 黄光芳;;正则表达式在远程网页下载中的应用[J];计算机与信息技术;2007年03期

中国重要会议论文全文数据库 前1条

1 王红滨;刘大昕;;元数据提取综述[A];黑龙江省计算机学会2009年学术交流年会论文集[C];2010年

中国博士学位论文全文数据库 前2条

1 周明建;基于本体的开放式知识管理研究[D];浙江大学;2004年

2 李书明;数字化学习中知识组织模型及应用研究[D];华中师范大学;2011年

中国硕士学位论文全文数据库 前10条

1 沙有闯;基于Web文本挖掘的网络口碑监测系统研究[D];安徽大学;2010年

2 朱媛媛;基于本体的电子商务信息抽取系统研究[D];河北大学;2011年

3 赵洋;数据仓库元数据集成系统的设计与实现[D];华中科技大学;2011年

4 陈尚安;林业企业黄页Deep Web数据集成研究[D];北京林业大学;2012年

5 张祯;知识管理系统中知识项建立的自动化研究[D];浙江大学;2005年

6 蒲宇达;基于web的网页链接与正文抽取技术研究[D];哈尔滨工业大学;2006年

7 潘冲;农业网站元数据管理信息系统的研究与实现[D];中国农业科学院;2008年

8 陈锋;对外汉语教材编写辅助系统的设计与实现[D];南京师范大学;2008年

9 莫凌琳;基于条件随机场的科研论文信息分层抽取研究[D];重庆大学;2009年

10 侯娜;基于条件随机场的元数据自动提取技术研究[D];燕山大学;2009年

【二级参考文献】

中国期刊全文数据库 前10条

1 张雪冰;韦璐;;C#中利用正则表达式提高数据录入效率[J];安徽建筑工业学院学报(自然科学版);2007年06期

2 张成洪,肖军建,张诚;Web内容抽取及其数据管理方法[J];复旦学报(自然科学版);2001年02期

3 胡立辉;张健;陈曦;;基于正则式的CNKI网页全自动包装器[J];长沙理工大学学报(自然科学版);2006年02期

4 金莉,卢正鼎;Web信息提取中多策略学习算法的研究[J];华中科技大学学报(自然科学版);2003年01期

5 李朝光,张铭,邓志鸿,杨冬青,唐世渭;论文元数据信息的自动抽取[J];计算机工程与应用;2002年21期

6 李跃进;赵晶;林鸿飞;;基于Internet的军事演习信息抽取系统[J];计算机工程与应用;2006年14期

7 李效东,顾毓清;基于DOM的Web信息提取[J];计算机学报;2002年05期

8 黄豫清,戚广志,张福炎;从WEB文档中构造半结构化信息的抽取器[J];软件学报;2000年01期

9 孟小峰,周龙骧,王珊;数据库技术发展趋势[J];软件学报;2004年12期

10 屠彤辉;;期刊论文的元数据描述探析[J];上海高校图书情报工作研究;2006年04期

【相似文献】

中国期刊全文数据库 前10条

1 佘广和;;试论学位论文的管理与利用[J];上海高校图书情报学刊;2000年04期

2 雷霆,张美娟;学位论文信息的获取途径和方法[J];图书情报知识;2002年02期

3 俞晓燕;高校学位论文管理之我见[J];大学图书情报学刊;2002年01期

4 刘传和;因特网上免费检索学位论文[J];医学情报工作;2002年05期

5 范爱红;姜静华;周锦文;;高校学位论文的电子化收集与管理[J];图书馆杂志;2002年07期

6 瞿学惠;;试论学位论文资源开发的现状及对策[J];科技文献信息管理;2002年03期

7 瞿学惠;我国高层次学位论文资源开发的价值、现状及对策[J];图书馆理论与实践;2003年02期

8 王磊,蔡志勤,王殿龙,杨光辉,王德伦,滕弘飞;学位论文的评价系统[J];大连理工大学学报(社会科学版);2003年02期

9 翁爱湘,张明;学位论文的修改[J];杭州电子工业学院学报(高等教育研究版);2003年02期

10 赵广示;谈谈学位论文的规范与创新[J];遵义师范学院学报;2004年03期

中国重要会议论文全文数据库 前9条

1 ;院研究生部毕业生学位论文题录[A];中国工程物理研究院科技年报(1998)[C];1998年

2 ;院研究生部1999年度毕业生学位论文题录[A];中国工程物理研究院科技年报(1999)[C];1999年

3 李经平;;浅谈学位论文的开发利用[A];高校信息理论研究[C];1997年

4 万红;;对学位论文全文数据库的展望[A];北京交通大学图书馆——第四届研讨会论文集[C];2004年

5 衡中青;侯汉清;;应该为学位论文编制内容索引[A];中国索引学会第三次全国会员代表大会暨学术论坛论文集[C];2008年

6 徐志伟;王黎;潘华峰;鄢来均;;21世纪针灸学研究生课程设置的思考——对我校近十年来针灸学学位论文的调查分析[A];全国中西医结合教育学术研讨会论文集[C];2000年

7 严建南;李清;;做好保密 促进利用——高校学位论文档案保密与利用关系的思考[A];中国档案学会第六次全国档案学术讨论会论文集[C];2002年

8 李春博;;索引在学位论文写作中的作用及其价值[A];2004年度中国索引学会年会暨学术讨论会论文集[C];2004年

9 丁娜;郑兰;;对高校图书馆学位论文管理工作的思考[A];北京交通大学图书馆——第四届研讨会论文集[C];2004年

中国重要报纸全文数据库 前10条

1 ;国防大学学位论文实行“双盲匿名评阅”[N];解放军报;2007年

2 住房和城乡建设部村镇建设办公室 牛大刚;从“学位论文授权使用书”看学位论文的使用和管理[N];中国现代企业报;2008年

3 记者 李大庆;学位论文侵权案一审终结[N];科技日报;2008年

4 欧建平;《舞蹈学位论文写作》应运而出[N];中国艺术报;2010年

5 吉林师范大学 王柏文 范钦杰 周殿龙;“国内留学”防止学位论文“近亲繁殖”[N];中国教育报;2009年

6 河南师范大学教授、《河南师范大学学报》副主编、全国高校文科学报研究会编委会副主任 孙景峰;规范学位论文审查和答辩管理[N];中国教育报;2012年

7 本报记者 杜晓;史上最严学位论文作假处理办法成效几何[N];法制日报;2012年

8 记者 高靓;学位论文作假行为处理办法今起实施[N];中国教育报;2013年

9 王贤才;学写学位论文[N];健康报;2002年

10 记者 王东亮;论文剽窃 三年内禁授学位[N];北京日报;2012年

中国博士学位论文全文数据库 前4条

1 王道红;学位论文质量管理研究[D];华东师范大学;2005年

2 Kishore Babu Bathula;[D];华东理工大学;2011年

3 Muddasir Hanif;[D];吉林大学;2008年

4 李小坤;英语学位论文的语类特征研究[D];浙江大学;2012年

中国硕士学位论文全文数据库 前10条

1 高立兰;我国学位论文抽检制度研究[D];湘潭大学;2011年

2 秦霞;学位论文著作权归属及利用问题研究[D];大连海事大学;2014年

3 王庆波;2002-2011年我国体育学硕士研究生足球学位论文研究现状与分析[D];华东师范大学;2013年

4 刘志鹏;D高校EMBA学位论文质量管理研究[D];大连理工大学;2013年

5 张昕;论学位论文电子化利用的许可模式[D];兰州大学;2007年

6 吕斐斐;学位论文预审分配管理系统研究[D];哈尔滨工业大学;2010年

7 王博;我国编辑出版类硕博学位论文选题的调查研究[D];河北大学;2009年

8 Souleymane TRAORE;[D];华东师范大学;2011年

9 司津锦;高校学位论文管理系统开发与应用[D];山西师范大学;2010年

10 王攀攀;中小学生命安全教育问题探究[D];西南大学;2011年


  本文关键词:基于特征及规则模式的学位论文元数据信息自动抽取研究?,由笔耕文化传播整理发布。



本文编号:367745

资料下载
论文发表

本文链接:https://www.wllwen.com/wenshubaike/xindetihui/367745.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户99b2a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com