融合多策略的军事领域中文术语抽取研究
发布时间:2022-02-20 00:57
军事术语是传递军事信息的主要载体,客观反映军事领域的变化与发展,军事领域术语抽取研究对于军事信息处理有着重要意义。以军事领域中文术语抽取为研究对象,在对军事领域术语的基本特征进行深入分析的基础上提出一种结合多策略的抽取方法。该方法融合了词典、规则、统计量度和机器学习算法于一体,在语料预处理阶段使用预先构造的军事术语词典辅助分词,在抽取阶段使用改进的条件随机场模型识别候选术语,在词形、词性等特征的基础上加入词典特征、句法依存关系特征,最后综合利用语言学规则和统计方法对候选术语进行过滤,获得最终术语列表。在收集的军事演习语料上的实验结果显示,该方法取得较好的抽取结果。
【文章来源】:现代计算机. 2020,(26)
【文章页数】:9 页
【文章目录】:
0 引言
1 领域中文术语抽取概述
1.1领域术语的概念和特点
1.2领域术语抽取的方法
2 军事领域术语的概念和特点
2.1军事术语的概念和特点
2.2军事术语抽取的特点和难点
3 融合多策略的军事领域术语抽取
3.1术语抽取过程
3.2基于改进CRFs的候选术语获取
3.3基于规则和统计量的术语过滤
4 实验结果及分析
4.1实验设置
4.2结果与分析
5 结语
【参考文献】:
期刊论文
[1]基于门控CNN-CRF的中文命名实体识别[J]. 陶源,彭艳兵. 电子设计工程. 2020(04)
[2]基于CRFs的专利文献领域术语抽取方法[J]. 王健,殷旭,吕学强,徐丽萍. 计算机工程与设计. 2019(01)
[3]基于语料库的军事术语抽取方法初探[J]. 许汉成. 外语研究. 2017(05)
[4]采用连续词袋模型(CBOW)的领域术语自动抽取研究[J]. 姜霖,王东波. 现代图书情报技术. 2016(02)
[5]一种基于统计技术的中文术语抽取方法[J]. 刘剑,唐慧丰,刘伍颖. 中国科技术语. 2014(05)
[6]基于条件随机场的领域术语识别研究[J]. 施水才,王锴,韩艳铧,吕学强. 计算机工程与应用. 2013(10)
[7]基于条件随机场的汽车领域术语抽取[J]. 李丽双,党延忠,张婧,李丹. 大连理工大学学报. 2013(02)
[8]领域术语特征分析——以军语为例[J]. 向音,李苏鸣. 中国科技术语. 2012(05)
[9]政务领域本体术语的自动抽取[J]. 翟笃风,刘柏嵩. 现代图书情报技术. 2010(04)
[10]采用CRF技术的军事情报术语自动抽取研究[J]. 贾美英,杨炳儒,郑德权,杨靖. 计算机工程与应用. 2009(32)
博士论文
[1]军语四十年发展变化研究[D]. 原媛.安徽大学 2014
硕士论文
[1]军事领域中文术语抽取的研究[D]. 田俊玮.大连理工大学 2013
本文编号:3633970
【文章来源】:现代计算机. 2020,(26)
【文章页数】:9 页
【文章目录】:
0 引言
1 领域中文术语抽取概述
1.1领域术语的概念和特点
1.2领域术语抽取的方法
2 军事领域术语的概念和特点
2.1军事术语的概念和特点
2.2军事术语抽取的特点和难点
3 融合多策略的军事领域术语抽取
3.1术语抽取过程
3.2基于改进CRFs的候选术语获取
3.3基于规则和统计量的术语过滤
4 实验结果及分析
4.1实验设置
4.2结果与分析
5 结语
【参考文献】:
期刊论文
[1]基于门控CNN-CRF的中文命名实体识别[J]. 陶源,彭艳兵. 电子设计工程. 2020(04)
[2]基于CRFs的专利文献领域术语抽取方法[J]. 王健,殷旭,吕学强,徐丽萍. 计算机工程与设计. 2019(01)
[3]基于语料库的军事术语抽取方法初探[J]. 许汉成. 外语研究. 2017(05)
[4]采用连续词袋模型(CBOW)的领域术语自动抽取研究[J]. 姜霖,王东波. 现代图书情报技术. 2016(02)
[5]一种基于统计技术的中文术语抽取方法[J]. 刘剑,唐慧丰,刘伍颖. 中国科技术语. 2014(05)
[6]基于条件随机场的领域术语识别研究[J]. 施水才,王锴,韩艳铧,吕学强. 计算机工程与应用. 2013(10)
[7]基于条件随机场的汽车领域术语抽取[J]. 李丽双,党延忠,张婧,李丹. 大连理工大学学报. 2013(02)
[8]领域术语特征分析——以军语为例[J]. 向音,李苏鸣. 中国科技术语. 2012(05)
[9]政务领域本体术语的自动抽取[J]. 翟笃风,刘柏嵩. 现代图书情报技术. 2010(04)
[10]采用CRF技术的军事情报术语自动抽取研究[J]. 贾美英,杨炳儒,郑德权,杨靖. 计算机工程与应用. 2009(32)
博士论文
[1]军语四十年发展变化研究[D]. 原媛.安徽大学 2014
硕士论文
[1]军事领域中文术语抽取的研究[D]. 田俊玮.大连理工大学 2013
本文编号:3633970
本文链接:https://www.wllwen.com/shekelunwen/renwuzj/3633970.html