基于云计算的微博舆情流式快速自聚类方法研究
本文关键词:基于云计算的微博舆情流式快速自聚类方法研究 出处:《情报科学》2017年08期 论文类型:期刊论文
更多相关文章: 微博舆情 云计算 流式 最小距离聚类算法 聚类阈值
【摘要】:【目的/意义】当前微博已成为重要的舆论场,针对海量微博信息的舆情难以快速获取的问题,提出一种基于云计算的微博舆情流式快速自聚类方法。【方法/过程】该方法首先设计舆情最小距离聚类算法,包括构建舆情相似度计算模型,及构建舆情最佳聚类阈值确定方法;然后构建舆情流式自聚类模型,该模型利用云计算和最小距离聚类算法在横、纵两个方向聚类舆情信息,得到各主题的舆情集合。在横向上,以云计算的多个计算节点为聚类起始,同步并行聚类分配到其上的舆情信息。在纵向上,多个计算节点协同、流水线式聚类同一起始节点的舆情信息;最后在纵向上聚类舆情集合,将同主题舆情集合聚为一类。【结果/结论】实验结果表明:该方法能有效加快微博舆情获取速度,且具有较高的舆情获取准确率。
[Abstract]:[Objective] the significance / micro-blog has become an important field of public opinion, public opinion for the massive micro-blog information is difficult to quickly obtain the problem, propose a micro-blog public cloud based streaming fast clustering method. [method] the first design / process method of minimum distance clustering algorithm including the construction of public opinion, public opinion similarity calculation model and, to build public opinion the best clustering threshold determination method; and then construct public opinion flow from clustering model, the model uses the cloud computing and the minimum distance clustering algorithm in horizontal, longitudinal direction of the two clustering information of public opinion, public opinion has each topic set. On the other hand, many computing nodes in cloud computing for initial clustering, synchronization parallel clustering assigned to public opinion information on it. In the vertical direction, a plurality of collaborative computing nodes, in line with public opinion information clustering starting node; finally set vertically in the clustering of public opinion, The same topic public opinion collection is clustered into a class. [result / Conclusion] experimental results show that this method can effectively speed up the acquisition of micro-blog public opinion and has high accuracy of public opinion acquisition.
【作者单位】: 河南牧业经济学院图书馆信息部;
【基金】:教育部人文社会科学研究项目(15YJC870004)
【分类号】:G206;TP391.1
【正文快照】: 微博是一种重要的社交网络平台,其以便捷、友好的交互优势广受大众青睐。目前,我国的微博注册用户量超过6亿,月活跃用户量超过2亿。由于允许快捷地编发、评论和分享微博信息,微博平台每天都有上百万条信息产生,已成为舆情产生和传播的重要源头,是我国最重要的网络舆论场之一【
【相似文献】
相关期刊论文 前10条
1 张素梅;;关于舆情信息工作的几点思考[J];长治学院学报;2007年S1期
2 于家琦;;舆情信息工作规范探析[J];前沿;2008年03期
3 王荟;魏学宏;;浅析信息社会中舆情、信息、舆情信息、微观经济行为之耦合联系[J];济源职业技术学院学报;2008年02期
4 张垒;;舆情信息产品:现状、困境与趋势[J];现代传播(中国传媒大学学报);2011年10期
5 刘毅;马缘园;;我国舆情信息工作现状分析与对策研究——以“我国舆情信息工作专业人才需求问卷调查”为例[J];新闻界;2011年06期
6 艾新革;罗春荣;;政府职能部门舆情信息服务需求调研分析——以广州市为例[J];图书馆论坛;2012年03期
7 王小兰;;舆情信息工作的实践困境及现实建构[J];福建行政学院学报;2012年02期
8 刘军;;浅谈舆情信息及其写作[J];秘书之友;2013年04期
9 卢桂茂;;对做好当前企业舆情信息工作的一点看法[J];办公室业务;2013年10期
10 金茵;;为政府舆情信息工作服务的信息源剖析[J];兰台世界;2013年29期
相关会议论文 前1条
1 龙妍;;适用于新闻媒体的新技术、新应用[A];中国新闻技术工作者联合会五届一次理事会暨学术年会论文集(上篇)[C];2009年
相关重要报纸文章 前10条
1 通讯员 易银军;市委宣传部荣获全国舆情信息工作先进单位[N];长江日报;2005年
2 阎久石;我省出台《关于加强舆情信息工作的意见》[N];甘肃日报;2004年
3 郭鹏;围场县委宣传部舆情信息工作成绩显著[N];承德日报;2006年
4 记者 张启民 实习生 张金丽;全区调研舆情信息工作会议在我市召开[N];赤峰日报;2007年
5 记者 李晓萌 通讯员 刘强 黄晗;广泛收集社情民意 提高舆情信息质量[N];长江日报;2007年
6 本报记者 王媛媛;全面提高舆情信息工作整体水平[N];楚雄日报(汉);2006年
7 马霁梅;中宣部舆情信息局局长甄占民到楚雄调研[N];楚雄日报(汉);2007年
8 通讯员 魏超鹏;州委宣传部切实抓好舆情信息工作[N];大理日报(汉);2007年
9 记者 张永兵;辽宁石油化工大学成立舆情信息研究基地[N];抚顺日报;2007年
10 记者 白育庆;甘省舆情信息和调研工作会召开[N];甘肃日报;2007年
相关硕士学位论文 前10条
1 张静民;乐亭县政府舆情信息工作优化研究[D];燕山大学;2015年
2 刘小溪;基于短文本分类的微博舆情信息检测系统的设计与实现[D];兰州大学;2015年
3 兰军;科创学院舆情信息管理系统的设计与实现[D];电子科技大学;2014年
4 刘峰;基于数据挖掘技术的舆情监控系统的设计与实现[D];电子科技大学;2015年
5 陈扬芳;地方政府应对突发公共事件舆情预警机制研究[D];湘潭大学;2015年
6 智佳宁;基于元搜索的舆情信息采集系统的设计与实现[D];北京交通大学;2016年
7 李强;运用项目人力资源管理理论改进宣武区舆情信息工作队伍建设的研究[D];北京邮电大学;2008年
8 陈俊明;基于思想政治教育的高校舆情信息工作创新研究[D];武汉科技大学;2011年
9 史进;新媒体时代兰州市舆情信息工作创新路径研究[D];兰州大学;2014年
10 石卉;基于网络内容分析法的舆情信息研究及应用[D];华中师范大学;2011年
,本文编号:1391619
本文链接:https://www.wllwen.com/xinwenchuanbolunwen/1391619.html