当前位置:主页 > 教育论文 > 对外汉语论文 >

基于海外版时政新闻语料库的对外汉语词汇研究

发布时间:2017-05-16 07:00

  本文关键词:基于海外版时政新闻语料库的对外汉语词汇研究,由笔耕文化传播整理发布。


【摘要】:《人民日报·海外版》由于自身的权威性、发行量巨大、多覆盖面多国别的阅读群体、有别于国内主流报纸的独特风格使其独具对外汉语研究方面的价值。本文选择其2009-2011年度时政新闻作为我们的研究对象,对时政新闻语料进行筛选入库,建成约180万字的“海外版时政新闻原始语料库”,通过对原始语料库的3593篇语料进行分类编目、二次筛选、分词及词性标注等程序,建成了一个规模为2547篇语料、约57万字的“海外版时政新闻赋码语料库”。对语料库进行词频统计,生成词条总计18130条、总词次350322次的原始词表,再经人工干预校改,制成包含词条14452条278345总词次的《汉语国际教育用海外版时政新闻语域词频表》,通过对此词频表的词语频差分析,最终选取了2804个高频词作为汉语国际教育用海外版时政新闻语域主要研究对象,生成了一个以词频高低排列为主、音序排列为辅的带有词性、词频标记的高频词表,即《汉语国际教育用海外版时政新闻语域高频词表》,最后用此高频词表与《汉语国际教育用分级词汇表》进行对比分析,得出本文研究的结论,即《汉语国际教育用海外版时政新闻语域高频词表》将对对外汉语的词汇教学,,特别是报刊词汇教学,提供必要的数据支撑。“海外版时政新闻语料库”所选取的语料对对外汉语教材的编排具有一定的使用价值,应该改变词表交集占比较低的现状,在汉语国际教学中适当适度增加时政新闻语域的教学内容。
【关键词】:时政新闻 语料库 对外汉语 词汇
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:H195
【目录】:
  • 中文摘要4-5
  • Abstract5-9
  • 第1章 绪论9-15
  • 1.1 选题缘起9
  • 1.2 研究的目标及意义9-10
  • 1.3 研究方法10-11
  • 1.4 研究路线图11-12
  • 1.5 研究现状综述12-15
  • 1.5.1 基于国内主流媒体和汉语教材的语料库建设研究12-13
  • 1.5.2 基于语料库的对外汉语用词汇研究13-15
  • 第2章 海外版时政新闻语料库的创建15-32
  • 2.1 海外版时政新闻语料库属性15-18
  • 2.1.1 语料来源15
  • 2.1.2 选材标准15-17
  • 2.1.3 选材方法17-18
  • 2.2 语料库的预加工18-24
  • 2.2.1 入选语料的分类标准19-21
  • 2.2.2 分类编目基本规则21-22
  • 2.2.3 分类编目赋码22
  • 2.2.4 分类编目与二次筛选后的语料分布情况说明22-24
  • 2.3 语料库标注24-31
  • 2.3.1 机器分词与自动标注24
  • 2.3.2 词性标注符号标记说明24-25
  • 2.3.3 标注语料库校对依据25
  • 2.3.4 人工校对流程25-26
  • 2.3.5 分词与词性标注过程中存在的问题及处理26-31
  • 2.4 本章小结31-32
  • 第3章 基于海外版时政新闻语料库的词频统计与分析32-37
  • 3.1 词频统计软件及统计结果32
  • 3.2 原始词表的处理32-35
  • 3.3 海外版时政新闻语域词频分级研究35-36
  • 3.4 本章小结36-37
  • 第4章 词表对比研究37-41
  • 4.1 《汉语国际教育用音节汉字词汇等级划分》简介及其词汇构成37
  • 4.2 词表比对的目的37
  • 4.3 词表比对方法与原则37-38
  • 4.4 词汇分布比例分析38-40
  • 4.5 本章小结40-41
  • 第5章 结语41-44
  • 5.1 本文研究总结41
  • 5.2 不足之处41-42
  • 5.3 需要进一步开展的工作42-44
  • 参考文献44-48
  • 附录一:“海外版时政新闻语料库”简介48-50
  • 附录二:《海外版时事政治新闻语料库分类新闻语料目录》(略)50-51
  • 附录三:《汉语国际教育用海外版时政新闻语域高频词表》51-100
  • 致谢100

【参考文献】

中国期刊全文数据库 前3条

1 卢伟;语料库在对外汉语教学中的应用[J];厦门大学学报(哲学社会科学版);1999年04期

2 俞士汶,段慧明,朱学锋,孙斌;北京大学现代汉语语料库基本加工规范(续)[J];中文信息学报;2002年06期

3 崔刚,盛永梅;语料库中语料的标注[J];清华大学学报(哲学社会科学版);2000年01期

中国重要会议论文全文数据库 前2条

1 张洁;孟遥;于浩;;基于分词性能的汉语语料库比较研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年

2 邹红建;杨尔弘;;面向对外汉语报刊教学的文本难易度分类[A];第三届学生计算语言学研讨会论文集[C];2006年

中国博士学位论文全文数据库 前3条

1 赵小兵;基于动态流通语料库的现代汉语基本词汇自动识别与提取方法研究[D];北京语言大学;2007年

2 韩秀娟;基于动态流通语料库的通用词语用字研究及字词语关系考察[D];北京语言大学;2007年

3 史艳岚;基于中国主流报纸动态流通语料库的对外汉语报刊新闻主题词群及相关研究[D];北京语言大学;2006年

中国硕士学位论文全文数据库 前2条

1 贺胜;面向现代汉语文本处理的全文检索、自动分词通用系统[D];南京师范大学;2006年

2 徐曼;《中文新闻信息分类标准》研究[D];武汉大学;2005年


  本文关键词:基于海外版时政新闻语料库的对外汉语词汇研究,由笔耕文化传播整理发布。



本文编号:370117

资料下载
论文发表

本文链接:https://www.wllwen.com/jiaoyulunwen/duiwaihanyulunwen/370117.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d305c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com