日语自动词性赋码器的信度研究
本文关键词:日语自动词性赋码器的信度研究
【摘要】:词性自动赋码技术的日臻成熟为语料库建设提供了有力支撑。与本族语语料不同,学习者产出中充斥着大量错误。这必然会对赋码的准确性造成干扰。因此,除了精度以外,抗干扰能力也是需要着重考虑的因素。本文统计并比较了日语开源自动词性赋码器对学习者语料赋码的精度以及赋码信度与语料质量的相关性。从中发现,MeCab表现最出色,ChaSen次之,JUMAN则稍逊一筹。此外,研究证实,日语开源赋码器对学习者语料赋码的精度甚至超过了本族语语料。因此,完全可以充当语料库建设的可靠工具。
【作者单位】: 上海外国语大学;
【基金】:2012年教育部人文社会科学研究青年基金项目课题“中国日语学习者表达失误的认知语言学研究(12YJC740076)” 上海外国语大学青年科研创新团队项目“基于日语学习者语料库的二语习得研究(QJTD11MWW01)”的研究成果
【分类号】:H36
【正文快照】: 1引言从研究方法看,基于学习者语料库的研究大致可以分为中介语对比分析(CIA)和计算机辅助错误分析(CEA)两种(Granger et al.,2002)。由于国内现有的各类学习者语料库几乎都未进行词性赋码,标注局限于各类表达失误,导致我国基于学习者语料库开展的二语习得研究也以计算机辅助
【参考文献】
中国期刊全文数据库 前4条
1 毛文伟;;日语学习者产出文本特征的量化分析[J];解放军外国语学院学报;2012年01期
2 梁茂成;;学习者英语书面语料自动词性赋码的信度研究[J];外语教学与研究;2006年04期
3 毛文伟;;语料库在历时语言学研究领域的应用——以对机能辞「とたん(に)」的考察为例[J];外语电化教学;2009年01期
4 毛文伟;;整合型学习者语料库平台的规划与实现——以中国日语学习者语料库CJLC的构建为例[J];现代教育技术;2009年09期
【共引文献】
中国期刊全文数据库 前10条
1 吴宁;徐筠;;英汉应用语言学实证论文体裁对比分析——以方法部分为例[J];毕节学院学报;2009年11期
2 刘艾娟;;中国大学生的语块使用频率及类别与写作质量的相关性研究[J];长春师范学院学报(人文社会科学版);2010年07期
3 李新利;;学习者笔语中BE动词的类联接研究[J];疯狂英语(教师版);2011年03期
4 王晓燕;;运用计算机技术和任务教学法提高英语教学水平[J];长春理工大学学报;2012年03期
5 郑玉荣;栾岚;王丽丽;;我国语料库研究发展历程分析[J];黑龙江教育学院学报;2011年06期
6 陈功;;语料库检索的模式、问题及启示[J];当代外语研究;2011年10期
7 毛文伟;;日语学习者产出文本特征的量化分析[J];解放军外国语学院学报;2012年01期
8 毛文伟;;基于语料库的历时语言学研究——以对瞬间继起机能辞的考察为例[J];日语学习与研究;2010年04期
9 毛文伟;;二语习得量化研究中两种数据采集方法的对比研究[J];日语学习与研究;2011年01期
10 王莉;梁茂成;;学习者口语语料自动词性赋码的信度研究[J];外语教学;2007年04期
中国博士学位论文全文数据库 前3条
1 葛诗利;面向大学英语教学的通用计算机作文评分和反馈方法研究[D];北京语言大学;2008年
2 潘鸣威;多模态视角下的口语交际能力:重构与探究[D];上海外国语大学;2011年
3 朱慧敏;大学生英语写作中的词汇丰富性发展特征研究[D];山东大学;2011年
【二级参考文献】
中国期刊全文数据库 前10条
1 梁燕,冯友,程良坤;近十年我国语料库实证研究综述[J];解放军外国语学院学报;2004年06期
2 高见;戴曼纯;;英语学习者主题结构的习得研究[J];解放军外国语学院学报;2009年01期
3 孙海燕;;中国EFL学习者搭配能力的发展特征探析[J];外语研究;2008年02期
4 毛文伟;;日语词辞转化的可能性初探——兼论机能辞的来源及分类[J];日语学习与研究;2006年04期
5 张雪梅;杨滢滢;;英语专业学习者的时态习得现状——一项基于中国英语专业写作语料库的研究[J];外国语文;2009年03期
6 文秋芳 ,丁言仁,王文宇;中国大学生英语书面语中的口语化倾向——高水平英语学习者语料对比分析[J];外语教学与研究;2003年04期
7 吴福祥;近年来语法化研究的进展[J];外语教学与研究;2004年01期
8 毛文伟;;论语料库信息自动筛选技术的实现及排错——以对接尾词“み”的考察为例[J];外语电化教学;2007年01期
9 马刚;吕晓娟;;基于中国学习者英语语料库的情态动词研究[J];外语电化教学;2007年03期
10 毛文伟;;语料库在历时语言学研究领域的应用——以对机能辞「とたん(に)」的考察为例[J];外语电化教学;2009年01期
【相似文献】
中国期刊全文数据库 前10条
1 朱宝锋;;学生英语写作中的词汇冗余现象[J];重庆科技学院学报(社会科学版);2011年12期
2 杨行;;语料库工具与英语词汇教学之light Vs.heavy[J];科技信息;2011年16期
3 谭晶华;毛文伟;;中国日语学习者语料库CLJC建设及应用综述[J];日语学习与研究;2011年04期
4 谷婧;;语料库在中学英语词汇教学中的应用[J];新教育;2011年08期
5 梁健丽;;“英语作为通用语”语料库介评(英文)[J];语文学刊(外语教育与教学);2011年08期
6 刘艺;;英语职业教育中语料库作用探讨[J];黑龙江科技信息;2011年21期
7 李安玲;张晓雁;;探究语料库在英语写作教学中的应用[J];校园英语(教研版);2011年06期
8 董娜;;语料库与翻译教学[J];语文学刊;2011年09期
9 米歇尔·保尔;海伦·夏普维拉;迪莱塔·迪·洛克;斯戴芬妮亚·格拉斯亚尼;徐洁;;CoDiSV:奥斯塔山谷地区学校儿童书面作业的数字语料库[J];中国儿童文化;2010年00期
10 张敏;李学宁;;西方主要英语语料库结构代表性分析[J];赤峰学院学报(汉文哲学社会科学版);2011年06期
中国重要会议论文全文数据库 前10条
1 郭曙纶;;基于语料库的HSK多功能例解字典:设想与样例[A];2004年辞书与数字化研讨会论文集[C];2004年
2 梁红梅;尹晓霞;李宇庄;;有关语料库驱动下的外语在线自主学习的工作底稿[A];全国大学英语教学改革暨网络环境下外语教学学术研讨会论文集[C];2004年
3 许小星;亢世勇;孙茂松;刘金凤;;语料库语义成分标注的若干问题[A];第三届学生计算语言学研讨会论文集[C];2006年
4 宋鸿彦;刘军;姚天f ;刘全升;黄高辉;;汉语意见型主观性文本标注语料库的构建[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
5 黄玉;李生;孟遥;丁华福;;基于大规模语料库的英语从句识别[A];第一届学生计算语言学研讨会论文集[C];2002年
6 李明;;语料库·蓝本·双语词典[A];中国辞书学会双语词典专业委员会第五届年会暨学术研讨会论文集[C];2003年
7 郭启新;;论语料库与英汉词典配例[A];中国辞书学会双语词典专业委员会第四届年会暨学术研讨会论文集[C];2001年
8 蔡莲红;蔡锐;吴志勇;陶建华;;语音合成语料库的设计与声学特征分析[A];中国声学学会2002年全国声学学术会议论文集[C];2002年
9 孙述学;;新词语语料库建设的一些构想[A];2004年辞书与数字化研讨会论文集[C];2004年
10 王仁华;胡郁;李威;凌震华;;基于决策树的汉语大语料库合成系统[A];第六届全国人机语音通讯学术会议论文集[C];2001年
中国重要报纸全文数据库 前10条
1 何方雄;药企该青睐怎样的赋码产品[N];医药经济报;2010年
2 小城;物联网技术于中药监码赋码系统之应用[N];中国包装报;2010年
3 王超 唐晨;赋码令药企叫苦印企窃喜[N];中国新闻出版报;2011年
4 本报记者 赵玲;赋码时限无余地 质量问题“零容忍”[N];中国医药报;2011年
5 本报记者 李彦;基本药物包装赋码给印企大商机[N];中国新闻出版报;2011年
6 记者 王坤宁;商务方正合作开发辞书语料库及编纂系统[N];中国新闻出版报;2002年
7 记者 赵玲;基本药物进口品种需今年年底前完成赋码[N];中国医药报;2011年
8 本报记者 周建华;数字战略打造核心竞争力[N];中国图书商报;2001年
9 卢伟;文学语言的语料库研究方法[N];文艺报;2004年
10 王扬;爱创举办“药监赋码系统研讨会”[N];现代物流报;2008年
中国博士学位论文全文数据库 前10条
1 张廷香;基于语料库的3-6岁汉语儿童词汇研究[D];山东大学;2010年
2 夏云;基于语料库的英汉翻译小说常规化研究:历时的视角[D];山东大学;2010年
3 何婷婷;语料库研究[D];华中师范大学;2003年
4 孙广路;基于统计学习的中文组块分析技术研究[D];哈尔滨工业大学;2008年
5 王青;基于语料库的《尤利西斯》汉译本译者风格研究[D];山东大学;2010年
6 唐斌;《人民日报》中(1987-2007)农民工的话语再现[D];上海外国语大学;2010年
7 徐欣;基于语料库的英汉小说语篇中话语标记功能研究[D];山东大学;2011年
8 姜维;统计中文词法分析及其强化学习机制的研究[D];哈尔滨工业大学;2007年
9 张建梅;基于语料库的现代蒙古语简单陈述句句型分析研究[D];内蒙古大学;2010年
10 王丽;基于语料库的中国学习者英语口语中语用标记语研究[D];上海交通大学;2008年
中国硕士学位论文全文数据库 前10条
1 岳炳词;面向语言学研究的大规模汉语生语料库检索工具CCRLT[D];北京工业大学;2001年
2 徐琰;基于语料库的ONLY研究[D];大连海事大学;2003年
3 杨丽萍;基于语料库的英语专业大学生议论文限时写作中的四字词块研究[D];江西师范大学;2010年
4 李淼;用先进的语料库工具推进英语教学[D];首都师范大学;2004年
5 李春青;[D];电子科技大学;2004年
6 王蓉;新闻英语的批评性语篇分析[D];上海师范大学;2010年
7 刘鼎甲;连接成分的显化:基于语料库的中英文翻译文本对比[D];燕山大学;2010年
8 刘露露;汉语衍名的双事件隐喻分析[D];四川外语学院;2011年
9 黄洁;基于语料库的商务英语词汇特点的研究[D];大连海事大学;2010年
10 李艳梅;基于语料库的中国英语学习者与本族语者阐发性话语标记语的对比分析[D];沈阳师范大学;2011年
,本文编号:1238456
本文链接:https://www.wllwen.com/waiyulunwen/lxszy/1238456.html