强化学习在用户学习中的应用研究
发布时间:2022-02-14 05:11
当用户每次上网检索网页时,他访问的这些网页都是与某些特定的主题有关的。目前大多数搜索引擎都对用户的兴趣不敏感。一个改良的用户界面应该根据用户描述排序所有的检索结果。另外,搜索引擎每次根据用户当前输入的几个关键词检索到的信息常常偏离用户的实际需要;能否快速准确地学习用户,掌握用户的兴趣需求在特定领域的搜索引擎中变得尤为重要,它直接关系到用户对该检索工具的信赖程度。从而,一种采用高效的学习用户兴趣的学习算法的软件在特定领域的检索引擎中变得越来越重要。由于这些基本问题以及对特定领域的信息学习的需要,本文以强化学习的时间差分法和向量表示为基础,提出了一种高效的学习用户兴趣的策略,并设计了一个学习用户兴趣的用户界面。该策略的主要特点是,使用向量表示用户模型和文档信息,从宏观和微观角度分析学习模型和强化学习的映射关系,并采用了跟踪用户的隐式反馈学习和包含输入和选择J胜的显式反馈学习方法,向量的归一化处理,以及结合面向用户兴趣学习的实际问题对问题相关的几个算法作了扩充。最后我们做了一个的实验,结果发现:在使用木论文的学习策略学习用户兴趣后,得到的用户模型在整体性、精确性和逼近目标的速度L<...
【文章来源】:太原理工大学山西省211工程院校
【文章页数】:73 页
【学位级别】:硕士
【文章目录】:
第一章 绪论
1.1 个性化,学习用户研究的必要性
1.2 论文研究的内容和组织
第二章 强化学习概述
2.1 强化学习的概念及其相关内容
2.2 强化学习的应用--典型的系统介绍
2.2.1 backgammon
2.2.2 WAIR
2.2.3 Webwatcher
第三章 相关的理论与技术
3.1 AGENT的概念及其基本特征
3.2 KQML
3.3 文档的向量模型及其更新策略
第四章 用户AGENT系统模型
4.1 基于多AGENT的PSBA系统构架
4.2 文档的向量描述
4.3 用户模型
4.4 强化学习与学习模型的映射
4.4.1 宏观的映射
4.4.2 微观的映射
第五章 用户AGENT的实现
5.1 用户界面的设计
5.2 用户模型
5.3 文档向量类及其文档向量表示的实现
5.4 用户学习评估算法实现
5.5 文档与用户模型的匹配度计算
5.6 与其他AGENT通信的实现
第六章 试验结果
6.1 实验的设置
6.2 试验结果
第七章 结束语
附录1
附录2
致谢
参考文献
【参考文献】:
期刊论文
[1]智能网站Agents的研究[J]. 殷信义,刘锦高,吴添华,何炜丽,Mohammed. 计算机应用研究. 2002(01)
[2]提高强化学习速度的方法研究[J]. 张汝波. 计算机工程与应用. 2001(22)
[3]一种基于强化学习的学习Agent[J]. 李宁,高阳,陆鑫,陈世福. 计算机研究与发展. 2001(09)
[4]一个个性化的信息搜集Agent的设计与实现[J]. 潘金贵,胡学联,李俊,张灵玲. 软件学报. 2001(07)
[5]基于Markov对策的多Agent强化学习模型及算法研究[J]. 高阳,周志华,何佳洲,陈世福. 计算机研究与发展. 2000(03)
[6]面向Internet的个性化智能信息检索[J]. 汪晓岩,胡庆生,李斌,庄镇泉. 计算机研究与发展. 1999(09)
本文编号:3624228
【文章来源】:太原理工大学山西省211工程院校
【文章页数】:73 页
【学位级别】:硕士
【文章目录】:
第一章 绪论
1.1 个性化,学习用户研究的必要性
1.2 论文研究的内容和组织
第二章 强化学习概述
2.1 强化学习的概念及其相关内容
2.2 强化学习的应用--典型的系统介绍
2.2.1 backgammon
2.2.2 WAIR
2.2.3 Webwatcher
第三章 相关的理论与技术
3.1 AGENT的概念及其基本特征
3.2 KQML
3.3 文档的向量模型及其更新策略
第四章 用户AGENT系统模型
4.1 基于多AGENT的PSBA系统构架
4.2 文档的向量描述
4.3 用户模型
4.4 强化学习与学习模型的映射
4.4.1 宏观的映射
4.4.2 微观的映射
第五章 用户AGENT的实现
5.1 用户界面的设计
5.2 用户模型
5.3 文档向量类及其文档向量表示的实现
5.4 用户学习评估算法实现
5.5 文档与用户模型的匹配度计算
5.6 与其他AGENT通信的实现
第六章 试验结果
6.1 实验的设置
6.2 试验结果
第七章 结束语
附录1
附录2
致谢
参考文献
【参考文献】:
期刊论文
[1]智能网站Agents的研究[J]. 殷信义,刘锦高,吴添华,何炜丽,Mohammed. 计算机应用研究. 2002(01)
[2]提高强化学习速度的方法研究[J]. 张汝波. 计算机工程与应用. 2001(22)
[3]一种基于强化学习的学习Agent[J]. 李宁,高阳,陆鑫,陈世福. 计算机研究与发展. 2001(09)
[4]一个个性化的信息搜集Agent的设计与实现[J]. 潘金贵,胡学联,李俊,张灵玲. 软件学报. 2001(07)
[5]基于Markov对策的多Agent强化学习模型及算法研究[J]. 高阳,周志华,何佳洲,陈世福. 计算机研究与发展. 2000(03)
[6]面向Internet的个性化智能信息检索[J]. 汪晓岩,胡庆生,李斌,庄镇泉. 计算机研究与发展. 1999(09)
本文编号:3624228
本文链接:https://www.wllwen.com/jiaoyulunwen/jiaoyutizhilunwen/3624228.html