当前位置:主页 > 教育论文 > 高等教育论文 >

大学生网络行为与学习成绩的相关性研究

发布时间:2021-07-29 13:22
  随着高校校园网的建设逐步普及,校园网成为了学生上网的最主要途径,同时在出口防火墙上产生了大量的网络行为数据。在这些海量数据的背后,还藏匿着一些人们凭直觉和经验很难发现的信息。然而,传统的数据库技术很难从大量的数据中获取有价值的信息。分析学生用户的网络行为数据,可以有效地帮助学校管理者和学术专家了解学生的网络行为偏好以及不同学生用户群体的各种网络行为,网络行为是否影响学业成绩等。通过采集学校网络中心防火墙服务器上记录的学生大量网络行为日志,利用Web使用挖掘的方法,对数据进行处理和转换,引用了N-gram语言模型,根据日志数据中URL(Uniform Resource Locator,统一资源定位符)的特征提取出关键词,根据关键词对URL进行分类,从而完成根据网页行为分类模型对用户浏览的网页进行分类的目的,根据用户对不同类型的网站的点击量,计算出用户对不同网站类型的浏览占比。最后通过与学生学习成绩的关联分析,得出网页浏览主题与学生成绩的相关性结果,并对结果进行解释与评估。文章总体上分成五个部分,首先在第一章主要阐述了用户行为分析的研究现状和意义和论文的主要内容以及组织结构,第二章分析了与... 

【文章来源】:浙江师范大学浙江省

【文章页数】:81 页

【学位级别】:硕士

【部分图文】:

大学生网络行为与学习成绩的相关性研究


用户行为的研究趋势

过程图,数据挖掘,过程


11减少风险,作出正确的决策[5]。通常需要通过模式识别、在线分析处理、统计、机器学习、情报检索和专家系统等多种方法才能完成挖掘的目标,因此,数据挖掘技术被认为是一种集多种方法于一身的交叉性研究领域。到目前为止,数据挖掘技术的发展经历了四个阶段:数据搜集、数据访问、数据仓库和数据挖掘。数据挖掘(DataMining,DM)通常又称为数据库中的知识发现(KnowledgeDiscoveryinDatabase,KDD),然而严格来讲,KDD指从数据中发现有用知识的整个过程,包括最开始的设定目标到最后的结果分析,数据挖掘被认为是KDD这个过程中一个特定的步骤。数据挖掘的定义是:从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的但又是潜在有用的信息和知识的过程,并且把提取到的知识和信息用概念、规律、模式、约束、可视化等方式表现出来[6]。2.2.2数据挖掘的过程为了保证数据挖掘的过程中能够按计划有条不紊的进行,许多数据挖掘顾问公司和软件供应商都会在开始数据挖掘之前制定好挖掘的步骤,一般情况下数据挖掘的过程是:陈述问题和阐明假设、数据准备和预处理、算法选择与挖掘数据、结果解释和评估。数据挖掘的过程如图2.1所示。图2.1数据挖掘的过程[5]王元卓,靳小龙,程学旗.网络大数据:现状与展望[J].计算机学报,2013,36(06):1125-1138.[6]唐晓萍.数据挖掘与知识发现综述[J].电脑开发与应用,2002(04):31-32+35.

网页,文档,页面,聚类


15图2.2Web挖掘的三大类(1)Web内容挖掘网页内容主要是呈现给用户的文档和多媒体数据,包括图像、视频、音频以及动画等,挖掘的对象是网页的文本内容和多媒体数据,主要的挖掘对象网页文本内容的挖掘。根据定义,Web内容挖掘是从网页文档和后台数据挖掘出信息,找出网页文档中有价值的知识。采用的方法包括归纳总结法、分类聚类法和数据建模的方法。网页文本分类是预先定义好需要分成的主题类别,通过训练数据建立网页分类器,利用网页分类器把预分类的文档一一划分至设定好的分类集合中,一个集合内的网页文档便属于一个类别,分好类的网页方便用户检索。与利用分类器分类网页不同的是聚类法,聚类不需要事先预定好分成的主题类别,它只需要确定需要聚类的几个中心,在同一个类别的文档就是离同一个中心最近的文档集合,不同类的网页文档离不同的聚类中心远。所有聚类又属于是一种无监督学习。(2)Web结构挖掘网页里的内容除了文档和多媒体数据外,通常还包含大量的URL链接,Web结构指的就是网页里的链接指向,即通过一个url可以进入另一个页面,这种不同网页之间建立起的连接就是Web结构挖掘的主要对象。通过url可以知道与一个网页有关系的其它网站,它们的关系可以是相互推荐的,也可以是隶属于的。这种网页之间的相关性可以用来鉴定当前网页的权威性或者用来发现与当前主题网页相关的的权威站点,因为当一个网页里有另一个网页的链接,说明另一个网页是受认可的。Web结构挖掘通常用于Web页面的发现。当挖掘出的多数页面都包含有对同一个页面有建立连接,至少可以说明这个页面是受到大多数认可的。(3)Web使用挖掘(Web日志挖掘)即Web日志挖掘,在使用Web上网过程中,用户会留下很多的记录,用户IP地

【参考文献】:
期刊论文
[1]关联分析在学生成绩数据挖掘的应用[J]. 狄晓娇.  电脑知识与技术. 2018(34)
[2]高校学生网络行为时序特征的可视化分析[J]. 严承希,王军.  情报学报. 2018(09)
[3]基于改进的n-gram模型的URL分类算法研究[J]. 骆聪,周城.  计算机技术与发展. 2018(09)
[4]一种面向海量网络审计日志的敏感用户挖掘分析架构[J]. 李栋科.  网络空间安全. 2018(04)
[5]基于大数据平台的用户画像与用户行为分析[J]. 谢康,吴记,肖静华.  中国信息化. 2018(03)
[6]基于Spark的用户行为分析系统框架研究[J]. 殷乐,姚远,刘辰.  网络安全技术与应用. 2018(02)
[7]基于层次聚类法的“知乎”用户细分与行为分析[J]. 陈娟,吴卓青,邓胜利.  情报理论与实践. 2018(07)
[8]基于联合特征的钓鱼网页分类方法[J]. 贾雪鹏,容晓峰.  电子技术与软件工程. 2018(02)
[9]基于系统日志的高校图书馆研究间用户利用行为分析[J]. 尹相权,李书宁,弓建华.  现代情报. 2018(01)
[10]一种基于机器学习的网页分类技术[J]. 孙靖超.  信息网络安全. 2017(09)

硕士论文
[1]基于URL模式的网页分类算法研究[D]. 杨镒铭.中国科学技术大学 2016
[2]基于URL特征的网页分类研究[D]. 李玄.南京邮电大学 2011



本文编号:3309403

资料下载
论文发表

本文链接:https://www.wllwen.com/jiaoyulunwen/gaodengjiaoyulunwen/3309403.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e398d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com