当前位置:主页 > 管理论文 > 货币论文 >

基于核函数的多因子选股模型实证研究

发布时间:2021-10-01 02:08
  本文主要介绍了核主成分分析(KPCA)、支持向量回归(SVR)、核fisher判别分析(KFDA)等以核函数为基础的学习算法,并把这些方法用于多因子选股理论当中。文章首先给出了核函数的定义与它的一些较为重要的性质,利用核函数,数量积可以在特征空间中进行隐式计算,而不需要知道具体映射,然后将此原理用于监督学习和无监督学习,进行基于核函数的算法推导。主成分分析(PCA)是无监督学习理论中常用的一种算法,主要思想是通过正交性的变换将有相关关系的样本转变为线性无关的样本,并依据一定准则选取少数的新变量体现原本多个变量含有的重要信息。由于PCA为线性算法,它无法提取变量中隐含的非线性结构,核主成分分析(KPCA)作为以核函数为基础的非线性特征提取方法,首先将样本中的变量映射到高维空间然后求解一个与PCA相似的线性组合问题得到核PCA成分。支持向量回归(SVR)引入的是结构风险最小化理论,并且应用ε不敏感函数作为模型的损失函数,对于一组训练数据确定一个函数使它可以精确地逼近未来的值。非线性支持向量回归则是用核函数方法把样本变量映射到一个高维空间,并通过建立线性函数达到在输入空间中的非线性回归效果,... 

【文章来源】:山东大学山东省 211工程院校 985工程院校 教育部直属院校

【文章页数】:55 页

【学位级别】:硕士

【部分图文】:

基于核函数的多因子选股模型实证研究


图2-1:样本映射到高维空间??

支持向量,函数,回归函数


?山东大学硕士学位论文???y?i丨??^?ri??1?〇?/?ix)?■?tr?\r?.*??〇?o??■>^-〇??..-〇"?〇??〇?r??图2-2支持向量回归原理??线性支持向量回归首先用线性函数:??f(x)?=?wTx?+?b?(2-19)??拟合样本,其中X为输入量,y为输出量。并且用s不敏感函数作为模型的损失??函数,具体指的是当真实值与估计函数值两者差别不大于4青形下,就确定在这??个点估量值不存在损失。??假设所有样本在给定的精度S下用(2-19)式的线性函数拟合可以得到:??y,-/(、)“+!??<?f(xi)-yi<s?+?^ii?=?\,2,---,n?(2-20)??其中6,#为松弛变量,如果划分存在误差,则两个变量都大于〇,划分正确则??两者都为0。而支持向量回归问题能够转换为求以下函数的最小化,SP:??min?i??(?w,¥,||?||wf?+?1)?(2-21)??(2-21)式中w2能够让回归函数更加平坦,从而加强模型的可推广性能,而C??代表对超过给定精度样本的惩罚系数,可以减小回归函数的误差。这是一个有约??束条件的函数求解问题,构建拉格朗日函数并且由对偶理论最终可以将原始问题??变为:??n?1?n?八??啤?么—a')-啦?—a')(H)x厂?'?(2-22)??a,a?/=1?^?/=1?j=\??14??

原理图,判别分析,原理


?山东大学硕士学位论文???第3章f?i?sher判别分析与核f?i?sher判别分析??3.1二分类f?i?sher判别分析原理与准则??Fisher判别分析法的目的是寻找一个线性函数,即将原始样本空间中p维向??量映射到某个方向,使属于不同类别的样本投影后在新空间中能够很好地分离。??而可分性是由两个量来衡量的:预计的平均值相距多远(应该很大)以及数据在??这个方向上的方差有多大(应该很小),具体如图3-1所示。??x2?11?I?y?—?-w1?x??li—:—?-??/尽可能?近」??O?Xi??图3-1?fisher判别分析原理??假设有数据集乃={(X,,乃),(x2,),…,(xm,少J,},其中用?'?(卢。,1),〇?0,1),??//;(j?=?G,l),?I;(j?=?(U)分别来表示第j类变量的个数、集合、均值与协方差矩阵,??定义类内散度矩阵为:??x^X0?xeXi??定义类间散度矩阵为:??=(M〇 ̄M]?)(M〇?-?A?Y?(3-2)??所以二分类fisher判别分析的优化目标为:??w?Shw??argmaxJ(w)?=?-—(3-3)??v—v—;?w?tS?w??M.??由广义Rayleigh商的定义可以知道(3-3)式的最大值为矩阵乘积的最大??特征值,所以投影向量w就是相应的特征向量。??Fisher判别准则有多种方法,下面介绍较为常用的一种,已知找到的线性??投影的方向为wT,则对两个类别数据的中心点投影并且令判别值c为:??17??

【参考文献】:
期刊论文
[1]随机森林在量化选股中的应用研究[J]. 王淑燕,曹正凤,陈铭芷.  运筹与管理. 2016(03)
[2]股票投资价值分析的综合指标及其创新指向[J]. 顾纪生,朱玲.  商业研究. 2012(02)
[3]A股市场的风险与特征因子[J]. 潘莉,徐建国.  金融研究. 2011(10)
[4]PCA-GA-SVM模型的构建及应用研究——沪深300指数预测精度实证分析[J]. 徐国祥,杨振建.  数量经济技术经济研究. 2011(02)
[5]多核学习方法[J]. 汪洪桥,孙富春,蔡艳宁,陈宁,丁林阁.  自动化学报. 2010(08)
[6]KPCA方法过程研究与应用[J]. 杜卓明,屠宏,耿国华.  计算机工程与应用. 2010(07)
[7]基于无约束优化的非线性支持向量回归[J]. 张军峰,胡寿松.  控制与决策. 2009(01)
[8]基于核主成分分析与最小二乘支持向量机结合处理时间序列预测问题[J]. 郭辉,王玲,刘贺平.  北京科技大学学报. 2006(03)
[9]基于支持向量回归的时间序列预测[J]. 杨金芳,翟永杰,王东风,徐大平.  中国电机工程学报. 2005(17)
[10]中国股票市场FF多因子模型的比较分析[J]. 陈守东,孟庆顺,赵云立.  吉林大学社会科学学报. 2003(05)

博士论文
[1]再生核Hilbert空间的若干理论及应用[D]. 高二.国防科学技术大学 2012

硕士论文
[1]线性与非线性多因子选股模型在A股市场应用的比较研究[D]. 陈雨甜.哈尔滨工业大学 2019
[2]基于回归法的多因子选股模型的投资组合分析[D]. 司晓彤.青岛大学 2017
[3]四元数再生核希尔伯特空间微分理论及其应用[D]. 许文翠.哈尔滨工程大学 2016
[4]支持向量机中核函数和参数选择研究及其应用[D]. 朱春雷.南京林业大学 2011
[5]支持向量机核函数的参数选择方法[D]. 范瑞雅.重庆大学 2011
[6]支持向量机中Sigmoid核函数的研究[D]. 刘明.西安电子科技大学 2009



本文编号:3417042

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/huobilw/3417042.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户fb46a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com