当前位置:主页 > 管理论文 > 领导决策论文 >

基于层次主题模型的社会网络意见领袖挖掘研究

发布时间:2021-05-06 20:27
  Web2.0诞生以来,互联网中的信息量呈现高速增长,信息质量的问题也随之而来,在社会网络中获得有价值的信息最有效的手段,就是找到网络上那些拥有丰富的专业知识和信息来源并且乐于传播知识和观点的意见领袖。但是,目前社会网络中意见领袖挖掘的相关研究存在着以下不足:1.目前大部分意见领袖挖掘的研究都是基于全局,忽视了意见领袖的领域局限性和专业知识局限性。2.大部分是从网络拓扑结构角度对意见领袖进行挖掘,忽视了意见领袖的内容特性、个人属性信息和用户互动信息。3.虽然也有一些学者考虑了意见领袖的这些特征,但是他们多数只是简单地将这些属性进行多角度分析,并没有将其融合成一套体系进行综合研究。为了解决以上这些问题,本文选取基于用户交流互动的知识共享社区—知乎为背景和研究对象,将层次主题模型HDP引入到用户主题发现的文本挖掘过程中,然后选取了特定的话题领域,并在综合分析的基础上提出了用户影响力指标体系,并将其与PageRank算法相结合,提出了本文中的zhihu-leadear-rank算法,本算法提高了意见领袖的挖掘效果。本文主要进行了以下研究工作:首先,本文在进行用户文本主题挖掘过程中引入了层次主题... 

【文章来源】:福州大学福建省 211工程院校

【文章页数】:63 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第一章 绪论
    1.1 研究背景
    1.2 国内外研究现状述评
        1.2.1 关于社会网络中的意见领袖挖掘研究
        1.2.2 意见领袖国内外文献评述
        1.2.3 关于社会网络文本主题挖掘方面的研究
        1.2.4 社会网络文本主题挖掘文献评述
    1.3 主要研究内容和目标
        1.3.1 研究内容
        1.3.2 研究目标
        1.3.3 拟解决的关键问题
    1.4 研究的理论与现实意义
        1.4.1 理论意义
        1.4.2 现实意义
    1.5 研究特色与创新之处
第二章 相关理论基础
    2.1 社会网络的相关理论
        2.1.1 社会网络的概念
        2.1.2 社会影响力
    2.2 意见领袖相关概念界定
        2.2.1 意见领袖的概念
        2.2.2 意见领袖的特征
        2.2.3 意见领袖的作用及影响力
    2.3 意见领袖的识别的流程
    2.4 PageRank算法的基本思想
第三章 基于层次主题模型的意见领袖潜在主题发现
    3.1 潜在狄利克雷分配LDA模型
        3.1.1 潜在狄利克雷分配LDA的核心思想
        3.1.2 LDA的特点和不足
    3.2 层次主题模型HDP
        3.2.1 Dirichlet过程
        3.2.2 中国餐馆过程CRP
        3.2.3 Dirichlet过程混合模型
        3.2.4 分层Dirichlet过程
        3.2.5 Chinese Restaurant Franchise构造
        3.2.6 HDP的Gibbs采样
    3.3 实验分析
    3.4 本章小结
第四章 社会网络意见领袖影响力评价及模型构建
    4.1 社会网络意见领袖影响力分析
        4.1.1 社会网络意见领袖影响力因素分析
        4.1.3 意见领袖影响力的指标体系和模型构建
    4.2 基于意见领袖特征指标体系的PageRank算法改进及实现
        4.2.1 基于指标体系的PageRank改进算法
        4.2.2 算法实现
        4.2.3 算法收敛性分析
        4.2.4 算法时间复杂度分析
    4.3 本章小结
第五章 实验研究
    5.1 数据获取和数据预处理
        5.1.1 数据获取
        5.1.2 数据结构描述
        5.1.3 数据预处理
    5.2 潜在主题发现及数据描述
    5.3 改进PageRank算法在特定主题下实验及结果分析
        5.3.1 算法实验结果对比
        5.3.2 结果对比分析及有效性分析
    5.4 本章小结
总结与展望
    全文总结
    本文研究中存在的不足
    展望
参考文献
致谢
个人简历、在学期间的研究成果及发表的学术论文


【参考文献】:
期刊论文
[1]社会网络中基于UBTM模型的主题挖掘[J]. 李雷,朱玉婷,施化吉,周从华.  计算机应用研究. 2017(01)
[2]利用邻域“结构洞”寻找社会网络中最具影响力节点[J]. 苏晓萍,宋玉蓉.  物理学报. 2015(02)
[3]在线社交网络影响力分析[J]. 吴信东,李毅,李磊.  计算机学报. 2014(04)
[4]基于LDA主题模型的短文本分类方法[J]. 张志飞,苗夺谦,高灿.  计算机应用. 2013(06)
[5]基于LDA模型的中文微博话题意见领袖挖掘[J]. 冯时,景珊,杨卓,王大玲.  东北大学学报(自然科学版). 2013(04)
[6]影响力扩散概率模型及其用于意见领袖发现研究[J]. 樊兴华,赵静,方滨兴,李欲晓.  计算机学报. 2013(02)
[7]微博意见领袖的评估模型[J]. 李玉贞,胡勇,熊熙,马晓娟,张敏.  信息安全与通信保密. 2013(02)
[8]微博客意见领袖识别模型研究[J]. 王君泽,王雅蕾,禹航,徐晓林,王国华,曾润喜.  新闻与传播研究. 2011(06)
[9]基于MB-LDA模型的微博主题挖掘[J]. 张晨逸,孙建伶,丁轶群.  计算机研究与发展. 2011(10)
[10]论坛中的意见领袖自动发现算法研究[J]. 祝帅,郑小林,陈德人.  系统工程理论与实践. 2011(S2)

硕士论文
[1]基于SNA面向特定主题的意见领袖发现研究[D]. 朱义生.合肥工业大学 2012



本文编号:3172568

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/lindaojc/3172568.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户215bf***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com