当前位置:主页 > 教育论文 > 高中教育论文 >

基于回归分析的中文作文自动评分技术研究

发布时间:2018-05-04 21:48

  本文选题:自动评分 + 回归分析 ; 参考:《哈尔滨工业大学》2016年硕士论文


【摘要】:评分在教学过程中有着重要的地位,他是考核学生学习效果的手段,也是考查教师教学水平的必要方式,而评分最关注的是评分的公平性与客观性。随着人工智能的快速发展,利用人工智能的机器自动评分逐渐走入人们的视野,不难看出,机器自动评分技术具有人工评分不具备的客观性、中立性,同时高效而省时省力,可以反复的完成评卷工作等,具有诸多优异的特性。高考是全省乃至全国范围内的大型升学资格考试,每年愈百万人参加,它决定了考生选择大学和进入大学的资格标准,在我国有着不可替代的重要作用。高考中文作文评分为评分的一个特殊应用场景,由于绝大部分考生受到了良好的教育与培养,作文评分的评分对象有着较强的语言能力,语文作文考查考生语言能力的同时还需要考查考生的理解能力、逻辑思维能力、文学素养、知识积累等多各方面内容。然而,与高考评分的严肃性相对的,是高考中文作文评分紧迫的阅卷时间,评卷老师工作量极大,可以说作文人工评卷是对高考作文评分公平性与权威性的极大挑战。本文尝试使用自动评分技术对高考中文作文进行自动评分。为解决人工评分局限性,首先需要理解、分析中文作文考试以及评分过程的复杂性,也是本课题面对的机遇与挑战。本文将着重探讨基于回归分析的中文作文自动评分的核心技术,主要内容包括了:(1)评分过程概念的分离与抽象,提出合理的评价指标与目标优化参数,为后续实验与实验工作的评价建立了基础;(2)采用启发式的特征抽取方法,建立基于浅层语言特征的回归模型,设定了实验的基线(baseline)。归纳出本课题基于启发式特征抽取的基本实验方法与思路;(3)建立基于启发式的深层语言特征的回归模型,对深层的语言特征进行分析、拆分与抽取,并对实验结果进行了合理的归因,更加深入的理解问题本质,了解了作文评分的难点与要点,使得后续的工作更加聚焦。(4)尝试使用深度学习的方法,用篇章向量来表示文章,利用回归模型进行训练和测试,以探索自动特征抽取方法对系统的影响,从而突破系统某些的特定指标的瓶颈。
[Abstract]:Scoring plays an important role in the teaching process. It is not only a means to assess the students' learning effect, but also a necessary way to check the teachers' teaching level, and the most concern of the scoring is the fairness and objectivity of the scoring. With the rapid development of artificial intelligence, the machine automatic scoring using artificial intelligence has gradually come into people's view. It is not difficult to see that automatic machine scoring technology has objectivity, neutrality, high efficiency and time saving. You can repeatedly finish marking work, and so on, with many excellent characteristics. The college entrance examination is a large-scale examination of qualification for higher education in the whole province and even all over the country. Every year, more than one million people take part in it, which determines the qualification criteria for candidates to choose universities and enter universities, and plays an irreplaceable role in our country. The Chinese composition score of the college entrance examination is a special application scene of scoring. Because most of the examinees have received good education and training, the scoring object of the composition scoring has a strong language ability. It is necessary to examine the students' understanding ability, logical thinking ability, literary accomplishment, knowledge accumulation and so on while examining the language ability of the examinee in Chinese composition examination. However, in contrast to the seriousness of the college entrance examination score, it is the urgent time to mark the Chinese composition score of the college entrance examination, and the workload of the examination paper evaluation teacher is great. It can be said that the composition manual evaluation is a great challenge to the fairness and authority of the composition score of the college entrance examination. This paper attempts to use automatic scoring technology to automatically score Chinese composition in college entrance examination. In order to solve the limitation of artificial scoring, it is necessary to understand and analyze the complexity of Chinese composition examination and scoring process, which is also the opportunity and challenge faced by this subject. This paper will focus on the core technology of automatic scoring of Chinese composition based on regression analysis. The main contents include the separation and abstraction of the concept of the score process, and the reasonable evaluation index and objective optimization parameters are put forward. A heuristic feature extraction method is used to establish a regression model based on shallow language features and the baseline of the experiment is set up. The basic experimental methods and ideas of heuristic feature extraction are summarized. (3) the regression model of deep language feature based on heuristic is established, and the deep language feature is analyzed, split and extracted. The results of the experiment are attributed reasonably to understand the nature of the problem, understand the difficulties and key points of the composition scoring, make the follow-up work more focused. 4) try to use the method of deep learning and use the text vector to express the article. The regression model is used for training and testing to explore the influence of automatic feature extraction on the system, thus breaking the bottleneck of some specific indicators of the system.
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:G633.34;O212.1

【相似文献】

相关期刊论文 前8条

1 张爱文;王泉泉;;编程题自动评分模型的研究与实现[J];黑龙江科技信息;2007年09期

2 张美茹;朱金珊;;学生考试系统的研发[J];内江科技;2008年12期

3 陈慧宁;蔡永泉;杨文利;;VFP上机考试自动评分的研究[J];科技信息(科学教研);2008年16期

4 吴亚坤;郭海旭;;Office文档自动评分的研究与实现[J];辽宁大学学报(自然科学版);2008年04期

5 郑文奎;侯秀红;;基于ASP的网上练习系统[J];鲁东大学学报(自然科学版);2009年02期

6 莫红枝;;计算机一级Word和Excel操作自动评分的实现[J];实验科学与技术;2011年03期

7 吴成洲;;基于C/S模式的C语言考试系统的设计与实现[J];科技广场;2008年03期

8 ;[J];;年期

相关会议论文 前5条

1 杨晨;曹亦薇;;论文自动评分——作文评价的一场革命[A];全国教育与心理统计测量学术年会论文摘要集[C];2006年

2 彭星源;柯登峰;赵知;陈振标;徐波;;基于词汇评分的汉语作文自动评分[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年

3 戴腊梅;曹亦薇;;关于LSA对主观题自动评分的效度评价[A];全国教育与心理统计与测量学术年会暨第八届海峡两岸心理与教育测验学术研讨会论文摘要集[C];2008年

4 蔡黎;彭星源;柯登峰;赵军;;少数民族汉语考试作文自动评分的特征提取研究[A];第五届全国青年计算语言学研讨会论文集[C];2010年

5 柯登峰;彭星源;赵知;陈振标;王士进;徐波;;基于词汇等级的汉语作文自动评分技术[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年

相关重要报纸文章 前2条

1 孙召华 王光勇 本报特约通讯员 颜贵斌;科技元素越多,现代军营越靓[N];解放军报;2011年

2 特约记者 颜贵斌;现代警营该是什么样[N];人民武警报;2011年

相关硕士学位论文 前10条

1 刘明杨;高考作文自动评分关键技术研究[D];哈尔滨工业大学;2015年

2 梅红伟;基于VBA的Word文档操作自动评分算法研究[D];云南大学;2015年

3 苗靖洁;大学英语分级测试简答题计算机自动评分的误差分析[D];湖南大学;2009年

4 陈一乐;基于回归分析的中文作文自动评分技术研究[D];哈尔滨工业大学;2016年

5 陈立蜜;数据挖掘应用于在线听力简答题自动评分的研究[D];电子科技大学;2016年

6 宣华锋;Visual Basic程序设计题自动评分算法的研究及实践[D];浙江工业大学;2012年

7 仲红艳;数控技能考核中仿真操作考试自动评分方法研究与实现[D];上海师范大学;2007年

8 李亚男;汉语作为第二语言测试的作文自动评分研究[D];北京语言大学;2006年

9 熊永燕;基于作文自动评分理论的小学写作教学研究[D];华东师范大学;2015年

10 赫伽宁;结合动态测试与静态分析的编程题自动评分方法研究[D];哈尔滨工业大学;2008年



本文编号:1844798

资料下载
论文发表

本文链接:https://www.wllwen.com/zhongdengjiaoyulunwen/1844798.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户bbcf6***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com