基于博客语料库副词使用的性别差异实证研究
发布时间:2018-04-15 23:36
本文选题:语料库语言学 + 博客 ; 参考:《华中师范大学》2012年博士论文
【摘要】:本文以语料库语言学为理论指导,以国家语言资源监测与研究中心大规模博客语料库为真实数据来源,以实际语料中语言现象的出现概率为依据,针对博客中使用的副词进行统计分析,最终以探寻男女性别人群语言差异为研究目的。通过对总体副词、各次类副词、高低频副词、语义韵以及重叠副词等五个方面的精准统计、详细观察和充分描写,归纳、概括了现代汉语副词在这五个方面所表现出来的共性和差异,并从社会语言学的角度对其形成原因进行了简明扼要的阐释。事实上,研究视角上的开创性丰富和发展了汉语副词的系统研究;研究方法上的实证性使副词研究更具科学性和准确性。 我们依托计算机强大的索引、分词、标注、统计、计算等功能,针对大规模博客语料库中的男女副词进行了较为系统性的研究,在研究方法和手段方面也进行了尝试性的探索,为自然语言处理开辟了新的途径,为汉语语法教学、对外汉语教学、中文信息处理等方面提供语言运用的可靠信息和理论依据,为国内外语言专家学者提供相关学术性参考数据,也为国家语言政策、语言规划部门进行语言监测、制定国家语言标准提供真实语言数据。 除了绪论的第一章和关于语料库中副词的归类和判定的第二章外,本文内容大体分为六个部分: 第三章基于大规模博客语料库针对男女博客总体副词性别差异与共性进行了对比研究,发现共性大于差异。首先对国内外副词性别差异研究进行了述评,然后从男女博客总体副词、各次类副词、累加覆盖率与词种数关系、文本数与分布率、词长分布以及男女博客共用副词和独用副词等方面进行了研究。男性副词和女性副词的总数以及三大类中各总数相差不大,具有较强一致性。男性和女性副词各次类所占的比例一致:限制性副词描摹性副词评注性副词。男性、女性副词累加覆盖率趋势曲线图具有较强的相似性,男女副词在博客真实文本中都具有一种规律极强的分布情况。男性副词根据频率排序与分布率排序总体较为相似,仅有个别副词的排序有所变动。由于该博客语料库规模庞大,所以分布统计法和频率统计法统计的结果大致相当,没有达到统计意义上的显著水平。女性比男性使用副词的频次平均值多11628,女性在博客中使用副词的总体频次是男性的1.83倍,女性使用副词的频率远高于男性,这说明女性比男性更倾向于使用副词。随着男女副词词长的增加,平均频次却呈下降趋势。我们还发现女性副词的平均频次均比男性高,单字词高出的幅度最大,双字词其次,三字词的幅度更小,四字词的幅度最小。男性和女性副词共983个和985个,其中共用副词961个,各自的非共用副词分别有22个和24个。男性倾向于使用与政治、工作、游戏等相关的内容,副词选用也较为正式;女性则倾向于使用与感情、心理等相关的副词。 第四章对男女博客各次类副词的性别差异与共性进行了研究,发现共性与差异并存。该章以网络博客语料库中真实的数据为研究对象,对男女博客副词的各次类进行频次、频率、累计频率、累加覆盖率等方面进行统计分析,从而找出博客中不同性别对于副词各次类的不同使用规律,最终试图找出男女博客中的使用异同。在限制性副词的数量上,男性和女性大致相当。其中,各个次类的数量也大致相当。但女性使用时间副词、范围副词和程度副词数量都比男性偏多,男性使用关联副词、否定副词和协同副词数量都比女性偏多,频率副词和重复副词的数量等同。从各次类的数量上看,男性描摹性副词个数比女性多,其中,表方式、表状态和表情状的副词都比女性多,女性表比况的描摹性副词比男性多2个,但差异并未达到统计上的显著水平。在描摹性副词的使用中,女性更倾向于使用表比况的描摹性副词;而男性更倾向于使用表示方式、状态和情状的描摹性副词。女性比男性更倾向于使用评注性副词。女性使用副词“太”、“还是”、“真”、“一定”、“真是”的频率明显大于男性,而男性使用“当然”的频率明显大于女性,说明这些评注性副词均是高频词,但也存在着一定的性别差异。 第五章针对不同性别高频出现和低频出现的副词展开深入研究,试图客观、真实地探寻它们使用的不同规律。研究发现高低频副词方面差异大于共性。男性由高到低排序前152位副词为高频副词,占所有男性副词词种数的15.46%;女性由高到低排序前90位副词为高频副词,占所有女性副词词种数的9.14%,说明女性高频副词的平均频率更高。根据男女累加覆盖率与副词词种数递增趋势曲线图可知,女性累加覆盖率在90%之前,坡度更大,递增速度更快,词种数较少;相反,男性累加覆盖率在90%之前,上扬的坡度相对较小,递增速度较缓慢,词种数较多。从词长的角度来看,单字词的平均频次最高,男性和女性的平均频次分别达454825和879442;双字词的平均频次次之,男性和女性平均频次分别达104109和38322:三字词的平均频次更低,男性和女性平均频次分别达59335和22818;四字词均为0。随着词长的增加,平均频次却相反呈下降趋势。男性高频副词平均频次是男性副词平均频次的5.8倍,女性高频副词平均频次是女性副词平均频次的9.4倍,悬殊之大,也足以说明高频副词的频率之高。最后,对男性和女性中的否定副词进行了统计,发现男性和女性均有29个否定副词。男性使用频率较高的否定副词的总体数量高于女性,说明男性在博客中否定表达的需要较多,与否定副词的使用频率偏高有直接关系。 第六章对博客语料库中副词语义韵的性别差异进行了研究,发现以共性为主。本章基于数据和基于数据驱动的方法对“严重XX”的普遍性和局部性语义韵进行了较为系统的研究。研究发现,网络男女博客中不仅存在着由典型搭配构成的普遍性语义韵,而且还存在由异常搭配构成的局部性语义韵。与此同时,男性和女性之间也存在着细微的区别。语言使用者故意违背语言使用因循性,造成语义韵冲突,最终实现网络中特有、诙谐的表达效果。基于统计数据发现“严重+VP”、“严重+NP”和“严重+AP”三个类联接。其中,“严重+VP”类联接有205例,全部作状语,占全部有效频次的64.3%;“严重+NP”类联接有107例,全部作修饰语,占全部有效频次的33.5%;“严重+AP”类联接有7例,全部作状语,占全部有效频次的2.2%。基于统计数据,在319个实例中,3.8%(12/319)的搭配属于中性,其余96.2%(307/319)的搭配都是消极词汇,所构成的语义氛围都是消极语义,导致其右侧的语境是消极语义韵。我们认为“严重”具有极其明显的消极语义韵结构。 同时,我们也注意到“严重”的词类在三个类联接中有两个词类。在“严重+VP”和“严重+NP”类联接中“严重”均是形容词词性,分别修饰VP和NP,而在“严重+AP”类联接中“严重”应该是副词词性,相当于“非常”或“极其”。众所周知,纯状语性是副词的本质、区别性特征。其次,我们基于数据驱动的方法,计算出MI≥3的有效右侧搭配词共57个。其中,98.2%的搭配词具有消极的语义氛围,建立“严重”的语义韵结构。以上两种常规方法的研究表明:当距位为“N+l”时,“严重”的普遍性语义韵律具有明显的消极语义韵,搭配词在语境中营造了消极语义氛围。另外,我们对大规模博客语料库中男性和女性“严重”的局部性语义韵律进行了研究。在现实交际过程中,说话人可能故意违反搭配和谐的原则,选用不寻常的搭配在语义上构成冲突,形成积极、正面的语义氛围,最终造成语义韵冲突,并利用语义韵冲突实现特殊的交际效果。统计表明,在大规模博客语料库中已出现“严重”的异常搭配,频率极低,但已构成其积极局部性语义韵律。在男性博客语料中只发现了4个异常搭配,分别是“严重有感觉”、“严重地激励”、“严重清醒”和“严重感谢”;在女性博客语料中只发现了1个异常搭配,即“严重感谢”。 第七章利用大规模博客语料库对重叠副词进行准确的统计研究,重点考察了汉语中重叠副词男女使用的差异。男性重叠副词词种数为65个,占男性副词总种数的6.61%,女性为64个占女性副词总种数的6.5%;其中60个为共用重叠副词;男性独用重叠副词的个数为5个,占男性重叠副词总数的7.69%,女性独用重叠副词的个数为4个,占女性重叠副词总数的6.25%。男性的独用重叠副词更倾向于客观、动作等的描述,副词选用也较为正式,如“迟迟”、“缓缓”、“轻轻”等;而女性则倾向于使用与感情、内心等相关的副词,如“独独”、“牢牢”、“默默”、“时时处处”等重叠副词。其次,我们将根据外在形式将副词重叠分为完全重叠和部分重叠。完全重叠的研究表明:单音节重叠AA式中,女性副词的使用频率普遍比男性高,这与女性更倾向于使用偶数(逢双)音节的习惯有直接关系;双音节重叠AABB式中,男性和女性重叠副词分别有3个和4个,分别占重叠副词总数的3%和6%。部分重叠结构是在双音节AB的基础上,重叠为AAB式,只重叠词根,不重叠后缀,构成“AA然”。在男性和女性博客语料库中,男性和女性均只有一个“AA然”结构,即“悠悠然”,男性使用频次和频率均低于女性。再次,从重叠的内在结构角度,重叠式副词可分为有基式重叠副词和无基式重叠副词。作者分别对男性和女性中的有基式重叠和无基式重叠副词进行了详细的对比研究,结果发现:各种重叠式副词的词种数男女多少不一,女性使用频率普遍比男性偏高。最后,从语用的角度进行了对比,结果发现重叠式副词有两个相反的作用:一是使程度更深,语气更重,频率更快,二是使程度更浅,语气更轻,频率更低。 第八章是结语,指出本文在博客语料库中男女副词研究方面所进行的探索、不足以及后续可以开展的研究。
[Abstract]:......
【学位授予单位】:华中师范大学
【学位级别】:博士
【学位授予年份】:2012
【分类号】:H136
【参考文献】
相关期刊论文 前10条
1 肖奚强;范围副词的再分类及其句法语义分析[J];安徽师范大学学报(人文社会科学版);2003年03期
2 张北镇;周江林;;基于语料库的语义韵研究[J];安康学院学报;2008年02期
3 张敏;从类型学和认知语法的角度看汉语重叠现象[J];国外语言学;1997年02期
4 冯志伟;汉字和汉语的计算机处理[J];当代语言学;2001年01期
5 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
6 卫乃兴;基于语料库和语料库驱动的词语搭配研究[J];当代语言学;2002年02期
7 邓耀臣;词语搭配研究中的统计方法[J];大连海事大学学报(社会科学版);2003年04期
8 赵学德;;汉语的性别差异研究综述[J];妇女研究论丛;2008年06期
9 钱进;语言性别差异研究综述[J];甘肃社会科学;2004年06期
10 陈永红;语言性别差异现象分析[J];贵州社会科学;1998年02期
相关博士学位论文 前2条
1 褚俊海;汉语副词的主观化历程[D];湖南师范大学;2010年
2 贾改琴;现代汉语时间副词的形式语义研究[D];浙江大学;2009年
,本文编号:1756349
本文链接:https://www.wllwen.com/jiaoyulunwen/duiwaihanyulunwen/1756349.html