基于主题模型的中文词义归纳
本文选题:词义归纳 切入点:主题模型 出处:《四川大学学报(自然科学版)》2016年06期
【摘要】:词义归纳是在给定包含多义词语料的条件下,识别出多义词词义的过程,通常是采用聚类的方法.本文提出了基于主题模型的方法来解决中文词义归纳问题,基于主题模型的词义归纳方法关键之处在于使用文档的主题概率分布来推断多义词的词义分布.实验结果表明,本文方法在测试数据上获得了77.58%FScore值.
[Abstract]:Semantic induction is the process of recognizing the meaning of polysemous words under the given condition of containing polysemous words, usually by clustering. This paper proposes a method based on topic model to solve the problem of Chinese word meaning induction. The key point of the topic model-based word meaning induction method is to use the topic probability distribution of the document to infer the word meaning distribution of polysemous words. The experimental results show that the method has obtained the 77.58%FScore value on the test data.
【作者单位】: 四川大学电子信息学院;保密通信重点实验室;
【基金】:保密通信重点实验室基金(9140C110401140C11053)
【分类号】:TP391.1
【相似文献】
相关期刊论文 前7条
1 赖裕平;周亚建;丁洪伟;郭玉翠;郭春;杨义先;;混合逆狄利克雷分布的变分学习及应用[J];电子学报;2014年07期
2 温腊;芮建武;何婷婷;郭亮;;利用并行GPU对分层分布式狄利克雷分布算法加速[J];计算机应用;2013年12期
3 余传明;张小青;陈雷;;基于LDA模型的评论热点挖掘:原理与实现[J];情报理论与实践;2010年05期
4 陈广福;蔡国永;林航;王瑞丽;刘国宾;;多Agent系统中基于狄利克雷分布的信任模型[J];计算机工程;2011年14期
5 王旭仁;姚叶鹏;冉春风;何发镁;;一种并行LDA主题模型建立方法研究[J];北京理工大学学报;2013年06期
6 张彭成;翟玉庆;;基于可信机制的云服务提供商选择模型[J];南京师范大学学报(工程技术版);2013年02期
7 ;[J];;年期
相关会议论文 前1条
1 林琛;汪卫;;Web论坛上的垃圾贴过滤[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
相关硕士学位论文 前4条
1 曹赖平;基于LDA聚类的语义Web服务发现[D];南京大学;2016年
2 李云之;基于文本分析的标签推荐研究及实现[D];北京邮电大学;2012年
3 黄海魂;基于用户概貌和评分序列的混合托攻击检测[D];重庆大学;2014年
4 陈阳平;基于概率生成主题模型的图像场景分类方法研究[D];西安电子科技大学;2014年
,本文编号:1691779
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1691779.html