基于HowNet的用户兴趣挖掘研究及应用
本文关键词:基于HowNet的用户兴趣挖掘研究及应用
更多相关文章: HowNet 用户兴趣挖掘 网页分块 页面排序 搜索引擎
【摘要】:搜索引擎中用户查询和网页资源之间的相似度研究一直是页面排序的研究核心。利用HowNet对词语的语义层次架构模型,对用户的检索词进行兴趣挖掘,同时对检索词和挖掘出的兴趣关键词的语义相似度计算方法进行改进,用户的检索请求与分块后的网页资源进行相似度迭代计算。实验结果表明,改进的算法使得页面排序的准确率和首页命中率有了较大提高。
【作者单位】: 江苏商贸职业学院;
【分类号】:TP391.1
【正文快照】: 1引言伴随着互联网的快速发展,互联网平台上的数据呈现出指数增长的趋势,搜索引擎成为人们从海量数据中获取信息的主要方式之一。用户通过输入检索关键词向搜索引擎提交检索请求,搜索引擎根据用户提供的检索关键词在数据库中进行资源匹配,将满足匹配的资源按照相关性按序输出[
【参考文献】
中国期刊全文数据库 前10条
1 王小林;王义;;改进的基于知网的词语相似度算法[J];计算机应用;2011年11期
2 马慧芳;史忠植;;一种高效稳定的链接分析算法[J];计算机应用研究;2011年02期
3 卢露;赵靖;魏登月;;基于社会标注系统的Web用户聚类算法[J];计算机应用研究;2013年12期
4 孙滨;刘林;;一种基于《知网》的文本语义相似度的计算方法[J];计算机与数字工程;2014年02期
5 杨博;陈贺昌;朱冠宇;赵学华;;基于超链接多样性分析的新型网页排名算法[J];计算机学报;2014年04期
6 舒奔;尹珂;;基于内容与链接分析的主题爬虫研究与设计[J];计算机与现代化;2014年04期
7 刘健;刘奕群;马少平;张敏;茹立云;张阔;;搜索引擎用户行为与用户满意度的关联研究[J];中文信息学报;2014年01期
8 钱雪忠;吴志媛;;基于网页概率潜在语义信息的用户兴趣聚类[J];计算机工程与科学;2014年04期
9 史宝明;贺元香;吴崇正;;主题搜索引擎中爬虫搜索策略的研究[J];计算机工程与应用;2014年02期
10 段淮川;胡平;;基于主题特征和时间因子的改进PageRank算法[J];计算机工程与设计;2010年04期
【共引文献】
中国期刊全文数据库 前10条
1 李更生;卢罡;;基于时间反馈和分类技术的PageRank改进算法[J];北京化工大学学报(自然科学版);2013年S1期
2 王飞红;丁泽发;;基于Lucene的垂直搜索引擎设计与实现[J];电子技术与软件工程;2014年05期
3 邓丹君;周彩兰;;基于内容相关性和时间分析的改进PageRank算法[J];计算机与数字工程;2011年01期
4 杨格兰;涂立;;基于主题相关性和链接权重的PageRank算法[J];华中科技大学学报(自然科学版);2012年S1期
5 陈战胜;钮文良;王辉;孙浩;;一种适用于大规模的改进PageRank算法[J];科学技术与工程;2012年34期
6 朱征宇;孙俊华;;改进的基于《知网》的词汇语义相似度计算[J];计算机应用;2013年08期
7 吴秦;白玉昭;梁久祯;;一种基于语义词典的局部查询扩展方法[J];南京大学学报(自然科学);2014年04期
8 郭庆宝;贾代平;;融合反馈信息与内容相关度的PageRank改进算法[J];计算机工程与设计;2011年12期
9 张美珍;王治莹;;基于用户查询意图的搜索排序算法[J];天津理工大学学报;2012年03期
10 彭月娥;杨思春;李心磊;丁菲菲;向恒月;;面向中文问答社区的问题去重技术研究[J];苏州科技学院学报(自然科学版);2014年01期
中国硕士学位论文全文数据库 前10条
1 邓丹君;基于Lucene的垂直搜索引擎关键技术研究[D];武汉理工大学;2011年
2 薛萍;基于教育领域的垂直搜索引擎的研究与实现[D];天津师范大学;2011年
3 马燕;基于快速相似度的Web结构挖掘的研究[D];南京信息工程大学;2011年
4 白玉昭;垂直搜索引擎的研究与实现[D];江南大学;2012年
5 刘夏;基于业务模型的3G数据业务分析与预测[D];北京邮电大学;2012年
6 郭庆宝;基于PageRank的搜索引擎优化方法研究[D];山东师范大学;2012年
7 李辉;基于云计算环境的web结构挖掘算法研究[D];浙江理工大学;2012年
8 李波;基于自主推理的中文命名实体识别方法研究[D];西北大学;2012年
9 王义;基于语义场的文本检索技术的研究与实现[D];安徽工业大学;2012年
10 刘发明;社会网络分析与社团发现[D];山东大学;2012年
【二级参考文献】
中国期刊全文数据库 前10条
1 刘亚军,徐易;一种基于加权语义相似度模型的自动问答系统[J];东南大学学报(自然科学版);2004年05期
2 王晓东;郭雷;方俊;董淑福;;一种基于EMD的文档语义相似性度量[J];电子与信息学报;2008年09期
3 高炜;梁立;;一种改进的基于相似度的本体映射方法[J];甘肃联合大学学报(自然科学版);2009年05期
4 李胜;胡和平;;一种基于PLSA的高效检索方法[J];华中科技大学学报(自然科学版);2010年11期
5 张猛,王大玲,于戈;一种基于自动阈值发现的文本聚类方法[J];计算机研究与发展;2004年10期
6 郭景峰;赵玉艳;边伟峰;李晶;;基于改进的凝聚性和分离性的层次聚类算法[J];计算机研究与发展;2008年S1期
7 方加沛;黄战;;基于单类别文档分类的主题爬虫[J];计算机工程与应用;2010年16期
8 徐茜;彭进业;李展;;本体映射中一种综合的概念相似度计算方法[J];计算机工程与应用;2010年24期
9 贾瑞玉;耿锦威;宁再早;何成刚;;基于代表点的快速聚类算法[J];计算机工程与应用;2010年33期
10 马素琴;施化吉;;阈值优化的文本密度聚类算法[J];计算机工程与应用;2011年17期
【相似文献】
中国期刊全文数据库 前10条
1 范玉霞;;基于用户兴趣的分组模型在电子图书馆检索中的应用研究[J];商场现代化;2010年16期
2 王波,姚敏;基于信息抽取的匿名用户兴趣描述[J];华南理工大学学报(自然科学版);2004年S1期
3 白丽君;;基于COM技术的浏览器Agent初探[J];浙江工商大学学报;2006年03期
4 易爱平;廖祝华;张惠;;基于Google的个性化搜索系统的设计与实现[J];电脑知识与技术(学术交流);2007年01期
5 刘娟;;Web数据挖掘及其在个性化网上购物实现的探讨[J];企业技术开发;2007年07期
6 郑雅婷;张鹰;;Web文本挖掘技术在网上购物中的应用[J];牡丹江师范学院学报(自然科学版);2008年04期
7 田晓珍;张敏;;用户个性化模式中的匹配过滤算法研究[J];运城学院学报;2009年05期
8 谢文玲;潘建国;;基于语义相似度的个性化信息检索方法[J];计算机应用与软件;2011年05期
9 周之诚;;用户意图聚类的数字资源推荐方法[J];情报理论与实践;2011年06期
10 李健;李雪梅;;基于用户兴趣和工作背景的信息收集个性化实现方案[J];图书馆论坛;2007年02期
中国重要会议论文全文数据库 前10条
1 李晓黎;史忠植;梁永全;刘福桃;;INTERNET网上一种识别用户兴趣的学习方法[A];第十六届全国数据库学术会议论文集[C];1999年
2 廖祝华;刘建勋;易爱平;;基于用户兴趣的Web服务发现[A];2006年全国开放式分布与并行计算机学术会议论文集(三)[C];2006年
3 许欢庆;王永成;孙强;;基于加权概念网络的用户兴趣建模[A];第一届学生计算语言学研讨会论文集[C];2002年
4 吴丽辉;张凯;张刚;王斌;;个性化Web信息采集系统PSearch的设计[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
5 ;平方爱索互联网智能信息系统[A];中国中文信息学会第六次全国会员代表大会暨成立二十五周年学术会议中文信息处理重大成果汇报展资料汇编[C];2006年
6 王勇;刘奕群;张敏;马少平;茹立云;;基于用户兴趣分析的网页生命周期建模(英文)[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
7 郭岩;白硕;张凯;;网络日志规模分析和用户对Web的访问动机分析[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
8 孙静;郭奇;张志强;冯建华;;一种基于面向领域检索系统的用户兴趣获取方法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
9 张健沛;李连江;杨静;;个性化搜索引擎排序算法的研究与改进[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
10 姜丽华;张宏斌;;基于Multi-Agent的个性化Web信息采集系统[A];中国农业信息科技创新与学科发展大会论文汇编[C];2007年
中国重要报纸全文数据库 前10条
1 ;增值业务新老结合效果显著[N];人民邮电;2006年
2 国防科学技术大学 毛新军邋常志明;个人助手Agent的研究与应用[N];计算机世界;2007年
3 见习记者 骆海涛;MySpace创始人新生意:用Web2.0做元搜索[N];21世纪经济报道;2006年
4 中国科学院计算技术研究所 王 斌;内容为王[N];计算机世界;2004年
5 董军;资费、渠道、版权三大因素制约彩铃发展[N];中国经营报;2005年
6 Eric Newcomer;分布式SOA崭露头角[N];计算机世界;2007年
7 周婷;中国电信建国内最大动态黄页数据库[N];中国证券报;2007年
8 应晓敏 窦文华;技术架构[N];计算机世界;2003年
9 姚春鸽;宽带+娱乐:大发展孕育新商机[N];人民邮电;2007年
10 方文;什么是Google+?[N];人民邮电;2011年
中国博士学位论文全文数据库 前10条
1 谢兴;社会网络中兴趣发现与信息组织的研究[D];复旦大学;2011年
2 张召;在线论坛用户兴趣图谱发现与个性化信息推荐[D];华东师范大学;2012年
3 应晓敏;面向Internet个性化服务的用户建模技术研究[D];中国人民解放军国防科学技术大学;2003年
4 罗娜;基于本体的主题爬行技术研究[D];吉林大学;2009年
5 潘建国;基于语义的用户建模技术与应用研究[D];上海大学;2009年
6 杜阿宁;互联网舆情信息挖掘方法研究[D];哈尔滨工业大学;2007年
7 王灿;基于半监督流形学习的Web信息检索技术研究[D];浙江大学;2009年
8 刘东飞;智能双语搜索方法及搜索引擎的研究[D];武汉理工大学;2009年
9 陈浩;Web搜索的用户兴趣与智能优化研究[D];中南大学;2012年
10 郭岩;网络日志中用户兴趣的挖掘及利用[D];中国科学院研究生院(计算技术研究所);2004年
中国硕士学位论文全文数据库 前10条
1 刘春旭;大规模数据发送中基于复合控制原理的用户兴趣的自适应模型[D];四川大学;2001年
2 冯子威;用户兴趣建模的研究[D];哈尔滨工业大学;2010年
3 张璇;基于用户兴趣的个性化搜索引擎技术研究[D];湖南大学;2010年
4 邱春艳;基于粗糙集理论的智能信息检索方法的研究[D];东北师范大学;2005年
5 肖坤;面向用户兴趣的校园网聚类搜索引擎的研究与实现[D];国防科学技术大学;2010年
6 杨慧;个性化网络信息检索系统的研究和应用[D];南京工业大学;2005年
7 崔琰;基于用户兴趣及术语关系的查询扩展方法[D];河北大学;2011年
8 罗建利;基于用户兴趣的概念查询扩展研究[D];扬州大学;2005年
9 邓晓嘉;一种基于RSS用户兴趣的个性化搜索系统[D];北京工业大学;2010年
10 柏桂荣;基于RSS信息源的用户兴趣模型研究[D];南京航空航天大学;2010年
,本文编号:1238141
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1238141.html