基于调查字表词表注音的汉藏语言音系处理系统
本文选题:音标切分 切入点:语言调查软件 出处:《语言文字应用》2012年02期
【摘要】:计算机对语言调查表记音文本语料的音标校对、音系整理、编制同音字汇表和音节词素表,关键是从音标字符串中准确地切分音节、声母、韵母、声调。正向扫描最小数字字符匹配,可用于切分出音节字符串和声调数字串;正向扫描最小元音字符匹配,可用于切分声母和韵母。在此基础上,从字表和词表中随机提取例字例词,可快速生成音系表、同音字汇、音节词素表,从而大大提高语言田野调查的语料整理效率。
[Abstract]:Forward scan minimum digit character matching can be used to segment syllable string from tone digit string, and forward scan minimum vowel character matching can be used to segment consonant and vowel.On this basis, sample words are extracted randomly from word table and word table, which can quickly generate phonological table, homonym vocabulary and syllable morpheme table, thus greatly improving the efficiency of data sorting in language field investigation.
【作者单位】: 暨南大学汉语方言研究中心;
【基金】:暨南大学团队创新项目“濒危语言有声语档建设理论与实践研究” 国家语委2011年度十二五科研规划项目“中国濒危语言有声资源采集、传输和集成技术研究”(YB135-11)
【分类号】:H214
【共引文献】
相关期刊论文 前10条
1 王小海;关于计算词典学[J];辞书研究;2003年05期
2 付习涛;言语行为与自然语言处理[J];湖南第一师范学报;2004年02期
3 李良炎,何中市,易勇;基于词联接的语义表示方法和知识库建设[J];重庆大学学报(自然科学版);2004年04期
4 代建英,何中市;基于词性信息的汉语时间语词消歧算法[J];重庆大学学报(自然科学版);2005年09期
5 黎亚雄;;基于Jena的WordNet检索技术研究[J];福建电脑;2007年01期
6 朱译翔;;中文名词性谓词的语义角色标注的研究[J];福建电脑;2010年09期
7 姚敏锋;;基于短语译文组合的汉英翻译系统[J];广东外语外贸大学学报;2010年02期
8 张仰森,徐波,曹元大;自然语言处理中的语言模型及其比较研究[J];广西师范大学学报(自然科学版);2003年01期
9 李伟娜;;格语法理论在基础英语教学中的应用[J];广西师范大学学报(哲学社会科学版);2011年02期
10 谢少万;;顺应理论与人工智能[J];广西民族大学学报(哲学社会科学版);2008年S1期
相关会议论文 前3条
1 徐德宽;;现代汉语双宾构造中两个宾语的题元角色[A];第六届汉语词汇语义学研讨会论文集[C];2005年
2 刘纶鑫;陈艳林;;潘版国际音标鑫林输入法的工作原理及实现[A];江西省语言学会2006年年会论文集[C];2006年
3 董月凯;;汉字编码论析[A];语文现代化论丛(第七辑)[C];2006年
相关博士学位论文 前10条
1 林八鸽;《蒙古语连接形式知识库》的建设[D];内蒙古大学;2009年
2 田学东;光学公式识别技术研究[D];河北大学;2007年
3 斯·劳格劳;现代蒙古语依存句法自动分析研究[D];内蒙古大学;2011年
4 王志栋;语用要点识别模型研究[D];清华大学;2008年
5 谭红叶;中文事件抽取关键技术研究[D];哈尔滨工业大学;2008年
6 李金莲;基于平行语料库的中日被动句对比研究[D];山东大学;2010年
7 李军辉;中文句法语义分析及其联合学习机制研究[D];苏州大学;2010年
8 海银花;面向信息处理的蒙古语名词语义研究[D];内蒙古大学;2010年
9 张建梅;基于语料库的现代蒙古语简单陈述句句型分析研究[D];内蒙古大学;2010年
10 武文杰;现代汉语视觉行为动词研究[D];山东大学;2008年
相关硕士学位论文 前10条
1 朱译翔;中文名词性谓词的语义角色标注研究[D];苏州大学;2011年
2 苏燕;现代汉语标题结构类型的计算机自动分析[D];广西民族大学;2011年
3 黄勇杰;基于统计NLP技术的甲骨卜辞的分析研究[D];华东师范大学;2010年
4 阚明刚;一笔双叙和轭式搭配的认知研究[D];河北大学;2009年
5 李慧;对外汉语口语教材中词汇定量分析[D];山东大学;2011年
6 李春;特定人员信息抽取的通用屏幕比对软件的设计与实现[D];电子科技大学;2011年
7 刘建彪;GB13000汉字字符集异体关系研究[D];河北大学;2010年
8 李桂荣;《青史演义电子词典》虚词部分的构建[D];内蒙古大学;2010年
9 哈里旦木·阿布都克里木;基于Chart算法的维吾尔语句法分析系统的设计与实现[D];新疆大学;2010年
10 刘小华;汉英机器翻译中趋向动词的处理[D];大连理工大学;2005年
【相似文献】
相关期刊论文 前6条
1 夏中华;王华;;象州石龙客家话同音字汇[J];桂林航天工业高等专科学校学报;2011年02期
2 黑维强;;绥德义合话同音字汇[J];咸阳师范学院学报;2011年03期
3 黄启良;;广西灌阳话音系[J];方言;2011年03期
4 邢向东;;陕北吴堡东王家山方言同音字汇[J];方言;2011年03期
5 梁忠东;;博白地佬话同音字汇[J];桂林师范高等专科学校学报;2011年03期
6 韦玉丽;赵敏兰;;广西蒙山陈塘话音系[J];百色学院学报;2011年02期
相关博士学位论文 前6条
1 肖萍;江西吴城方言研究[D];苏州大学;2006年
2 王洁;汉语中介语偏误的计算机处理方法研究[D];北京语言大学;2008年
3 隋岩;基于“动态流通语料库”的“有效字符串”提取研究[D];北京语言大学;2004年
4 李星辉;湘南土话与湘南瑶语的接触和影响[D];湖南师范大学;2004年
5 王强军;基于动态流通语料库(DCC)的信息技术领域新术语自动提取研究[D];北京语言文化大学;2003年
6 杨建国;基于动态流通语料库(DCC)的汉语熟语单位研究[D];北京语言大学;2005年
相关硕士学位论文 前10条
1 黎平;广西百色话的语音特点及其嬗变[D];华中师范大学;2006年
2 冯登宁;靖边方言研究[D];西北大学;2008年
3 马广东;峄城方言语音研究[D];西北大学;2008年
4 谢斐;浙江上虞百官镇方言音系[D];浙江师范大学;2009年
5 张建华;子洲方言语音研究[D];西北大学;2011年
6 刘道锋;隆回高坪话和新化白溪话的比较研究[D];湖南师范大学;2003年
7 许小娟;安化东坪话语音研究[D];湖南师范大学;2004年
8 方岚;歙县(和溪)方言语音研究[D];苏州大学;2007年
9 高锐霞;从现代隆尧方言看《五方元音》的语音特点[D];河北师范大学;2007年
10 王丽君;浙江金华市孝顺镇方言音系[D];浙江师范大学;2011年
,本文编号:1695617
本文链接:https://www.wllwen.com/wenyilunwen/yuyanxuelw/1695617.html