基于XGBoost与线性模型的在线广告点击率(CTR)预测
发布时间:2023-04-02 18:11
广告点击率预估是互联网计算广告中的关键环节,点击率预估的准确性直接影响着互联网公司的广告收入。在广告推荐系统中使用机器学习算法能有效提高广告点击转化率,实现用户的个性化广告推荐,有效提高互联网公司的收益。现在有部分互联网公司还是以逻辑回归作为他们的点击率预估的主要工具,但逻辑回归的非线性表达能力较弱,为了捕捉到数据之间的非线性关系,我们需要大量人工经验特征,该过程需要花费大量时间,但人工能力有限,很难对非线性关系完全挖掘充分。同样的点击率预估问题,换一个场景就很难推广,并且依靠人工特征的方式也不够智能,因此在业界出现了对模型改进的尝试。本文从逻辑回归开始,依次介绍了XGBoost、因子分解机与场感知分解机。本文借鉴了Facebook在论文中提出的GBDT与逻辑回归的融合模型的思路,利用GBDT的非线性拟合能力,来充分学习各个特征之间的非线性关系,将叶节点作为逻辑回归的输入来增强逻辑回归的拟合能力。本文创新点在于对这一方法进行进一步改进,使用GBDT模型的改进版本XGBoost,以增加模型的精度与运算速度。同时本文使用逻辑回归的改进模型因子分解机与场感知分解机以进一步加强模型的非线性拟合...
【文章页数】:53 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景
1.2 国内外发展现状
1.3 本文主要研究的内容与创新点
1.4 论文的内容组织
第二章 基于统计的推荐算法
2.1 基于内容的算法
2.2 基于领域的算法
2.2.1 基于用户的协同过滤算法
2.2.2 基于物品的协同过滤算法
2.3 本章小结
第三章 基于统计学习的点击预测
3.1 基于矩阵分解的推荐算法
3.2 逻辑回归(Logisticregression)
3.3 XGBoost
3.4 因子分解机(FactorizationMachine)
3.5 场感知分解机(Field-awareFactorizationMachine)
3.6 基于XGBoost模型的自编码与线性模型结合方法
3.7 本章小结
第四章 实验与分析
4.1 数据集基本面分析
4.2 统计类特征
4.2.1 用户特征
4.2.2 商户特征
4.3 交叉特征
4.4 个性化特征
4.5 ID类特征
4.6 评价指标
4.6.1 ROC曲线与AUC
4.7 模型与效果分析
4.8 本章小结
第五章 总结与展望
参考文献
致谢
本文编号:3779699
【文章页数】:53 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 绪论
1.1 研究背景
1.2 国内外发展现状
1.3 本文主要研究的内容与创新点
1.4 论文的内容组织
第二章 基于统计的推荐算法
2.1 基于内容的算法
2.2 基于领域的算法
2.2.1 基于用户的协同过滤算法
2.2.2 基于物品的协同过滤算法
2.3 本章小结
第三章 基于统计学习的点击预测
3.1 基于矩阵分解的推荐算法
3.2 逻辑回归(Logisticregression)
3.3 XGBoost
3.4 因子分解机(FactorizationMachine)
3.5 场感知分解机(Field-awareFactorizationMachine)
3.6 基于XGBoost模型的自编码与线性模型结合方法
3.7 本章小结
第四章 实验与分析
4.1 数据集基本面分析
4.2 统计类特征
4.2.1 用户特征
4.2.2 商户特征
4.3 交叉特征
4.4 个性化特征
4.5 ID类特征
4.6 评价指标
4.6.1 ROC曲线与AUC
4.7 模型与效果分析
4.8 本章小结
第五章 总结与展望
参考文献
致谢
本文编号:3779699
本文链接:https://www.wllwen.com/jingjilunwen/jingjiguanlilunwen/3779699.html