基于用户评论和评分的协同过滤算法研究
发布时间:2021-08-09 11:14
近年来,协同过滤算法在推荐领域受到了广泛的关注及应用。传统协同过滤算法利用用户评分进行推荐,然而随着用户和商品数量的不断增加,评分数据的稀疏问题成为了制约传统协同过滤算法推荐效果的重要因素。现有的协同过滤算法中,将评论挖掘与协同过滤相融合的方法是缓解该问题的重要途径之一,其中使用主题模型进行评论挖掘的协同过滤算法由于能够发挥主题模型的数理统计特性和灵活的拓展性等优势而逐渐备受关注。但现有的这类算法没有充分考虑到用户评论的短文本特性与情感特性,利用主题模型得到的主题概率分布的准确性难以得到保证,成为了制约其推荐效果的重要因素。对评分矩阵进行预填充的方法也是现有的协同过滤算法中缓解数据稀疏问题的重要途径之一,但现有的算法在填充方法的合理性、适用性、准确性等方面均存在着不同程度的局限,难以有效提升推荐质量。为了缓解数据稀疏问题对现有的协同过滤算法推荐效果的影响,本文从评论挖掘和评分矩阵填充两个方面出发,提出一种基于用户评论和评分的协同过滤算法。首先,针对现有的协同过滤算法利用主题模型进行评论挖掘的局限性,提出在协同过滤算法中使用主题情感混合模型进行评论挖掘的方法,并利用评论挖掘获取到的用户情...
【文章来源】:北京交通大学北京市 211工程院校 教育部直属院校
【文章页数】:91 页
【学位级别】:硕士
【部分图文】:
图3-4手机评论示例??Fig3-4?An?example?of?mobile?phone?review??综合以上两个方面,本文提出一种改进的基于用户评论和评分的协同过滤算??
本文提出的CFBURR算法使用ASUM模型对用户评论进行挖掘,该模型在处??理评论文本时是以句子为基本单位的,因此需要对评论文本进行分句操作。以常??用的标点符号等对评论文本??进行分句。图4-2为京东网站上的一条手机评论示例,分句的代码和该条评论的分??句结果如图4-3所示。??
?0?0??图4-1京东网站的垃圾评论??Fig4-1?Garbage?comments?on?the?Jingdong?website??本文从商品评论信息中收集了许多垃圾评论的内容,采用关键句识别过滤的??方法进行过滤。除此之外,还有一些纯标点符号的评论,这种评论内容无法传递??有效信息,也作为垃圾评论进行处理。本文处理垃圾评论的函数代码如下。??函数名:spam?^filter??输入:原始评论集合??垃圾识别句集合??输出:过滤垃圾评论之后的评论集合??import?re??def?spam_fi]ter(src_comments_3ist,?spam_comments_list):??validcomments?一?list?=?口??for?comment?in?src_comments_list:??#如果该条数据的评论内容中出现了垃圾评论识别句,则舍弃该条数据??isspam?=?False??forspam—comment?in?spam—comments—list:??if?spam—comment?in?comment:??isspam?=?True??break??if?is—spam:??continue??#如果评论内容去掉标点符号之后为空,则舍弃该条数据??marks?-?"[\A!V_,;¥%A*(+\nV)|+——()?【】“’’?!?;?,。?、?@#Y%……&*()],’??comment?sub?=?re.sub(marks
【参考文献】:
期刊论文
[1]面向短文本情感分析的词扩充LDA模型[J]. 沈冀,马志强,李图雅,张力. 山东大学学报(工学版). 2018(03)
[2]一种融合聚类与用户兴趣偏好的协同过滤推荐算法[J]. 何明,孙望,肖润,刘伟世. 计算机科学. 2017(S2)
[3]基于社交关系的微博主题情感挖掘[J]. 黄发良,于戈,张继连,李超雄,元昌安,卢景丽. 软件学报. 2017(03)
[4]基于语义约束LDA的商品特征和情感词提取[J]. 彭云,万常选,江腾蛟,刘德喜,刘喜平,廖国琼. 软件学报. 2017(03)
[5]在线评论特征对消费者购买决策的影响[J]. 张睿,于陶静. 科技与管理. 2016(06)
[6]基于情境聚类优化的移动电子商务协同过滤推荐研究[J]. 翟丽丽,邢海龙,张树臣. 情报理论与实践. 2016(08)
[7]基于稀疏数据预处理的协同过滤推荐算法[J]. 陈宗言,颜俊. 计算机技术与发展. 2016(07)
[8]基于评论与评分的协同过滤算法[J]. 李伟霖,王成良,文俊浩. 计算机应用研究. 2017(02)
[9]一种融合情景和评论信息的位置社交网络兴趣点推荐模型[J]. 高榕,李晶,杜博,余永红,宋成芳,丁永刚. 计算机研究与发展. 2016(04)
[10]融合社交网络信息的协同过滤推荐算法[J]. 郭兰杰,梁吉业,赵兴旺. 模式识别与人工智能. 2016(03)
博士论文
[1]推荐系统关键技术研究[D]. 任磊.华东师范大学 2012
硕士论文
[1]基于改进主题模型的微博短文本情感分析的研究[D]. 黄俊衡.东南大学 2017
本文编号:3331965
【文章来源】:北京交通大学北京市 211工程院校 教育部直属院校
【文章页数】:91 页
【学位级别】:硕士
【部分图文】:
图3-4手机评论示例??Fig3-4?An?example?of?mobile?phone?review??综合以上两个方面,本文提出一种改进的基于用户评论和评分的协同过滤算??
本文提出的CFBURR算法使用ASUM模型对用户评论进行挖掘,该模型在处??理评论文本时是以句子为基本单位的,因此需要对评论文本进行分句操作。以常??用的标点符号等对评论文本??进行分句。图4-2为京东网站上的一条手机评论示例,分句的代码和该条评论的分??句结果如图4-3所示。??
?0?0??图4-1京东网站的垃圾评论??Fig4-1?Garbage?comments?on?the?Jingdong?website??本文从商品评论信息中收集了许多垃圾评论的内容,采用关键句识别过滤的??方法进行过滤。除此之外,还有一些纯标点符号的评论,这种评论内容无法传递??有效信息,也作为垃圾评论进行处理。本文处理垃圾评论的函数代码如下。??函数名:spam?^filter??输入:原始评论集合??垃圾识别句集合??输出:过滤垃圾评论之后的评论集合??import?re??def?spam_fi]ter(src_comments_3ist,?spam_comments_list):??validcomments?一?list?=?口??for?comment?in?src_comments_list:??#如果该条数据的评论内容中出现了垃圾评论识别句,则舍弃该条数据??isspam?=?False??forspam—comment?in?spam—comments—list:??if?spam—comment?in?comment:??isspam?=?True??break??if?is—spam:??continue??#如果评论内容去掉标点符号之后为空,则舍弃该条数据??marks?-?"[\A!V_,;¥%A*(+\nV)|+——()?【】“’’?!?;?,。?、?@#Y%……&*()],’??comment?sub?=?re.sub(marks
【参考文献】:
期刊论文
[1]面向短文本情感分析的词扩充LDA模型[J]. 沈冀,马志强,李图雅,张力. 山东大学学报(工学版). 2018(03)
[2]一种融合聚类与用户兴趣偏好的协同过滤推荐算法[J]. 何明,孙望,肖润,刘伟世. 计算机科学. 2017(S2)
[3]基于社交关系的微博主题情感挖掘[J]. 黄发良,于戈,张继连,李超雄,元昌安,卢景丽. 软件学报. 2017(03)
[4]基于语义约束LDA的商品特征和情感词提取[J]. 彭云,万常选,江腾蛟,刘德喜,刘喜平,廖国琼. 软件学报. 2017(03)
[5]在线评论特征对消费者购买决策的影响[J]. 张睿,于陶静. 科技与管理. 2016(06)
[6]基于情境聚类优化的移动电子商务协同过滤推荐研究[J]. 翟丽丽,邢海龙,张树臣. 情报理论与实践. 2016(08)
[7]基于稀疏数据预处理的协同过滤推荐算法[J]. 陈宗言,颜俊. 计算机技术与发展. 2016(07)
[8]基于评论与评分的协同过滤算法[J]. 李伟霖,王成良,文俊浩. 计算机应用研究. 2017(02)
[9]一种融合情景和评论信息的位置社交网络兴趣点推荐模型[J]. 高榕,李晶,杜博,余永红,宋成芳,丁永刚. 计算机研究与发展. 2016(04)
[10]融合社交网络信息的协同过滤推荐算法[J]. 郭兰杰,梁吉业,赵兴旺. 模式识别与人工智能. 2016(03)
博士论文
[1]推荐系统关键技术研究[D]. 任磊.华东师范大学 2012
硕士论文
[1]基于改进主题模型的微博短文本情感分析的研究[D]. 黄俊衡.东南大学 2017
本文编号:3331965
本文链接:https://www.wllwen.com/guanlilunwen/tongjijuecelunwen/3331965.html