汉语词频的历时演化研究
发布时间:2025-05-28 00:49
在语言系统的历时演化过程中,词的变化速度要快于语音和语法。词频,即词在特定文本或语料库中的使用频率,能够对语言的历时演化情况进行相对细致的描述和展示。本文从微观和宏观两个角度,运用计量语言学的词频研究方法对汉语历时演化中的一些量变情况进行了考察。在微观方面,本文以宋元时代、明代、清代和现代四个规模相等的语料库为基础,调查了从宋元至今常用代词在使用频率方面的量变情况。调查的代词包括人称代词:“我”、“吾”、“我们”、“俺”、“咱”、“你”、“汝”、“你们”、“您”、“他”、“他们”,指示代词:“这个”、“那个”、“这些”、“那些”、“这里”、“那里”和疑问代词:“谁”、“什么”、“哪个”、“哪些”、“哪里”。结果显示,不同代词在使用频率方面的历时变化趋势或各时代的变化幅度都是不同的。通过对各时代、各代词使用频率差异的检验、量化和排序,我们对具体代词在历时演化中的量变趋势有了更详细的了解,也为汉语历时演化研究中已有的观点和看法提供了数据支撑,弥补了传统研究方法在词频统计方面的不足。在宏观方面,本文分两部分对汉语书面语的历时发展情况进行了调查:第一部分通过对文言(1855年)、北京官话(190...
【文章页数】:256 页
【学位级别】:博士
【部分图文】:
本文编号:4047815
【文章页数】:256 页
【学位级别】:博士
【部分图文】:
图2.1对小说《林家铺子》进行分词后所形成的词的秩一频序列分布??
在这里我们再通过一个中文文本的实例来让读者对词的秩一频序列分布有更??直观的理解。??图2.1是以小说《林家铺子》的词频秩序号为X轴,词的频率为Y轴的一??个秩一频序列分布。其中“的”的秩序号为1,在文中出现的频率为571次,“了”??的秩序号为2,在文中出现的频率为467次......
图2.2小说《林家铺子》的部分秩一频序列分布??“”
序弓??图2.2小说《林家铺子》的部分秩一频序列分布??我们将“任意两个相邻频率之间的欧几里德距离”叫做一个弧段。例如:图2??中“的”所在的点到“了”所在的点之间的欧几里德距离就是一个弧段的长度,“了’’??所在的点到“林”所在的点之间的欧几里德距离又是一个弧段的长度.........
图3.3“我”使用频率的历时分布情况??
?现代??图3.3“我”使用频率的历时分布情况??在图3.3中,尽管“我”使用频率的上升趋势已经十分明显,但我们对于这种??趋势的判断是具有主观性的,科学地证实或证伪假设不能仅凭主观判断就得出结??论。同时,我们需要对“我”使用频率在不同的变化幅度进行量化,才能判断出在??哪个时....
图3.4“吾”使用频率的历时分布情况??
图3.4“吾”使用频率的历时分布情况??湘(1985)认为秦汉以后,“吾”可能只存在于书面语中。吴在唐五代,汉语口语中的第一人称代词已经完全统一于“我能够发现,“吾”在宋元到清代引述的人物话语中都有出就从口语中完全消失,而白话文献能够反映其所处时代的宋元到明代的白话文献中“吾”的....
本文编号:4047815
本文链接:https://www.wllwen.com/shoufeilunwen/rwkxbs/4047815.html
上一篇:当代艺术展览观看方式与设计研究
下一篇:没有了
下一篇:没有了