面向食品安全裁判文书的命名实体识别方法研究
发布时间:2021-11-11 13:07
针对食品安全领域案件高发的突出问题,采用条件随机场模型对食品安全裁判文书的命名实体进行识别。基于HanLP平台和引入自定义词典,识别裁判文书中的人名、地名、机构名、食品、毒害物、危害后果等命名实体,取得了较好的识别效果。实验结果表明,基于条件随机场模型的命名实体识别方法是有效的,有助于自动识别食品安全裁判文书中的相关实体,构建食品安全知识图谱。
【文章来源】:计算机时代. 2020,(10)
【文章页数】:4 页
【部分图文】:
命名实体识别流程
条件随机场定义:设X、Y为随机变量,P(Y|X)表示指定X条件下Y的条件概率分布,如果随机变量Y构成一个由无向图G=(V,E)表示的马尔可夫随机场[10],即:P (Ya|X,Yb,a≠b)=P(Ya|X,Yb,a~b),对任意结点v成立,则称条件概率分布P(Y|X)为条件随机场。式中a~b表示在图G=(V,E)中与结点a有边连接的所有结点b,a≠b表示结点a以外的所有结点,Ya,Yb表示结点a,b对应的随机变量。在命名实体识别问题中,线性链CRF较为常见,其结构如图2所示。线性链CRF定义:设X=(X1,X2,…,Xn),Y=(Y1,Y2,…,Yn)均为线性链表示的随机变量序列,在随机变量序列X给定的情况下,随机变量序列Y的条件概率分布P(Y|X)构成条件随机场[10],即:
【参考文献】:
期刊论文
[1]海量食品安全事件下的命名实体识别研究[J]. 徐飞,宋英华. 科研管理. 2018(07)
[2]基于条件随机场的农业命名实体识别[J]. 张剑,吴青,羊昕旖,王彬聪,吴宣为,徐向英,吕强. 计算机与现代化. 2018(01)
[3]中文电子病历命名实体和实体关系语料库构建[J]. 杨锦锋,关毅,何彬,曲春燕,于秋滨,刘雅欣,赵永杰. 软件学报. 2016(11)
[4]条件随机场模型在中文人名识别中的研究与实现[J]. 唐钊. 现代计算机(专业版). 2012(21)
[5]电子病历中命名实体的智能识别[J]. 叶枫,陈莺莺,周根贵,李昊旻,李莹. 中国生物医学工程学报. 2011(02)
[6]CRF与规则相结合的地理空间命名实体识别[J]. 鞠久朋,张伟伟,宁建军,周国栋. 计算机工程. 2011(07)
[7]基于层叠条件随机场的旅游领域命名实体识别[J]. 郭剑毅,薛征山,余正涛,张志坤,张宜浩,姚贤明. 中文信息学报. 2009(05)
[8]基于层叠隐马尔可夫模型的中文命名实体识别[J]. 俞鸿魁,张华平,刘群,吕学强,施水才. 通信学报. 2006(02)
[9]基于角色标注的中国人名自动识别研究[J]. 张华平,刘群. 计算机学报. 2004(01)
本文编号:3488911
【文章来源】:计算机时代. 2020,(10)
【文章页数】:4 页
【部分图文】:
命名实体识别流程
条件随机场定义:设X、Y为随机变量,P(Y|X)表示指定X条件下Y的条件概率分布,如果随机变量Y构成一个由无向图G=(V,E)表示的马尔可夫随机场[10],即:P (Ya|X,Yb,a≠b)=P(Ya|X,Yb,a~b),对任意结点v成立,则称条件概率分布P(Y|X)为条件随机场。式中a~b表示在图G=(V,E)中与结点a有边连接的所有结点b,a≠b表示结点a以外的所有结点,Ya,Yb表示结点a,b对应的随机变量。在命名实体识别问题中,线性链CRF较为常见,其结构如图2所示。线性链CRF定义:设X=(X1,X2,…,Xn),Y=(Y1,Y2,…,Yn)均为线性链表示的随机变量序列,在随机变量序列X给定的情况下,随机变量序列Y的条件概率分布P(Y|X)构成条件随机场[10],即:
【参考文献】:
期刊论文
[1]海量食品安全事件下的命名实体识别研究[J]. 徐飞,宋英华. 科研管理. 2018(07)
[2]基于条件随机场的农业命名实体识别[J]. 张剑,吴青,羊昕旖,王彬聪,吴宣为,徐向英,吕强. 计算机与现代化. 2018(01)
[3]中文电子病历命名实体和实体关系语料库构建[J]. 杨锦锋,关毅,何彬,曲春燕,于秋滨,刘雅欣,赵永杰. 软件学报. 2016(11)
[4]条件随机场模型在中文人名识别中的研究与实现[J]. 唐钊. 现代计算机(专业版). 2012(21)
[5]电子病历中命名实体的智能识别[J]. 叶枫,陈莺莺,周根贵,李昊旻,李莹. 中国生物医学工程学报. 2011(02)
[6]CRF与规则相结合的地理空间命名实体识别[J]. 鞠久朋,张伟伟,宁建军,周国栋. 计算机工程. 2011(07)
[7]基于层叠条件随机场的旅游领域命名实体识别[J]. 郭剑毅,薛征山,余正涛,张志坤,张宜浩,姚贤明. 中文信息学报. 2009(05)
[8]基于层叠隐马尔可夫模型的中文命名实体识别[J]. 俞鸿魁,张华平,刘群,吕学强,施水才. 通信学报. 2006(02)
[9]基于角色标注的中国人名自动识别研究[J]. 张华平,刘群. 计算机学报. 2004(01)
本文编号:3488911
本文链接:https://www.wllwen.com/falvlunwen/gongjianfalunwen/3488911.html