互联网教育舆情监测系统的设计与实现
发布时间:2017-07-06 03:06
本文关键词:互联网教育舆情监测系统的设计与实现
【摘要】:教育关乎民生,关系到国家的未来和民族的希望,直接关系到人们的切身利益和日常生活,是国民关注的重点。随着网络和通讯技术的不断发展,互联网进入到了更多的领域,涉及的范围越来越广,网民数量也越来越多,人们通过互联网表达思想、发泄情绪的方式十分方便快捷,网络舆论的形成迅速,舆情规模和影响都不容小视。舆情是民意的反映,如何去获取这些舆情信息,如何去了解大众对教育事业的期望,这些对于教育事业更好的发展具有很强的现实意义。 本文从上述背景出发,探讨网络舆情的形成模式,就互联网教育舆情的来源、类别及其特征进行研究,并以此为依据探讨互联网教育舆情信息源的获取和过滤等策略,进而设计和实现互联网教育舆情监测系统。具体来说,全文共分五个部分,第一部分是本文的绪论,主要阐述研究的背景和意义、国内外的研究现状以及本文研究的主要内容;第二部分是理论基础,主要是对舆情的形成模式,互联网教育舆情的来源、类别和特征进行分析,并对互联网教育舆情信息采集的策略和原则,互联网教育舆情主题词搜集和整理的策略,教育舆情主题内容过滤策略等进行研究和探讨;第三部分是关键技术研究,主要对互联网教育舆情监测系统的工作机制进行研究,对实现互联网教育舆情监测系统所用到的关键技术做进一步的分析和研究,为系统的实现奠定基础;第四部分是本文的重点内容,主要包括互联网教育舆情监测系统的设计与实现,分为系统设计和系统实现两个章节来阐述,互联网教育舆情监测系统的设计,包括系统总体框架设计、系统工作流程设计、系统各关键模块分析与设计等,并给出系统关键环节实现的设计方案;互联网教育舆情监测系统的实现部分,主要介绍系统开发环境和开发工具,面向教育主题网页爬行的实现,中文分词的修改与添加,主题词识别和获取的实现以及系统总体的整合与实现等;第五部分是结论和展望,主要来总结本文所做的工作,对今后的系统开发和研究工作提供一些建议和思路。
【关键词】:教育舆情 主题爬行 中文分词 Nutch
【学位授予单位】:华中师范大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:G434
【目录】:
- 摘要5-6
- Abstract6-10
- 1. 绪论10-16
- 1.1 研究背景及意义10-12
- 1.1.1 互联网发展现状10-11
- 1.1.2 舆情、网络舆情和互联网教育舆情的含义11
- 1.1.3 互联网教育舆情监测系统建设的重要性与必要性11-12
- 1.2 研究目的和内容12-13
- 1.3 国内外的研究现状分析13-15
- 1.4 论文结构及章节概要15-16
- 2. 互联网教育舆情监测理论研究16-27
- 2.1 舆情形成模式与互联网舆情监测的理论基础16-17
- 2.2 互联网教育舆情的来源、类别及其特征分析17-20
- 2.2.1 互联网教育舆情信息来源和类别分析18
- 2.2.2 互联网教育舆情特征分析18-20
- 2.3 互联网教育舆情信息收集原则和策略20-22
- 2.3.1 以教育舆情信息的价值量作为教育舆情信息收集的参考标准20-21
- 2.3.2 选择和使用科学合理的技术和方法收集教育舆情信息21-22
- 2.3.3 选择权威、可靠并具有代表性的信息源22
- 2.4 互联网教育舆情信息的主题词收集和整理策略22-25
- 2.5 互联网教育舆情主题内容的抓取过滤策略25-27
- 3. 互联网教育舆情监测系统的工作机制及关键技术研究27-36
- 3.1 互联网教育舆情监测系统工作机制剖析27-28
- 3.2 关键技术研究28-36
- 3.2.1 网络爬取技术28-31
- 3.2.2 网页信息预处理技术31-33
- 3.2.3 信息索引技术33-34
- 3.2.4 热点话题发现技术34-36
- 4. 互联网教育舆情监测系统的分析与设计36-49
- 4.1 互联网教育舆情监测系统的分析与总体设计思路36-37
- 4.1.1 系统需求分析36
- 4.1.2 系统总体设计思路36-37
- 4.2 系统总体框架设计37-39
- 4.3 系统功能分析39-40
- 4.4 系统工作流程及具体功能设计40-42
- 4.5 关键环节的技术实现方案设计42-49
- 4.5.1 主题爬虫设计方案43
- 4.5.2 中文分词的实现方案设计43-45
- 4.5.3 主题词提取实现方案设计45-47
- 4.5.4 索引和检索过程的实现方案设计47-49
- 5. 互联网教育舆情监测系统的开发与实现49-65
- 5.1 开发工具简介和开发环境配置49-52
- 5.2 面向教育主题网页爬取的实现52-55
- 5.3 中文分词的修改和添加55-57
- 5.4 主题词的识别和提取57-60
- 5.5 Carrot2对索引结果进行再次聚类的实现60-61
- 5.6 系统测试与分析61-65
- 6. 总结与展望65-67
- 6.1 总结65
- 6.2 存在的不足与改进策略65-67
- 参考文献67-70
- 在校期间的科研成果70-71
- 致谢71
【引证文献】
中国期刊全文数据库 前1条
1 徐正林;;研究生师生关系网络舆情之管窥——基于搜索引擎搜索结果的分析[J];学园;2012年06期
中国硕士学位论文全文数据库 前1条
1 单月光;基于微博的网络舆情关键技术的研究与实现[D];电子科技大学;2013年
,本文编号:524500
本文链接:https://www.wllwen.com/jiaoyulunwen/xueshengguanli/524500.html