当前位置:主页 > 医学论文 > 基础医学论文 >

基因-基因、基因-环境交互作用对复杂疾病的影响研究

发布时间:2025-06-24 03:31
  全基因组关联研究(Genome-Wide Association Study,GWAS)已识别出很多与人类复杂疾病相关的变异基因,但随着二代测序技术的飞速发展,基因数据呈几何倍数增长.由于基因数据具有样本数量小,维度高,数据噪声大等特点,通过传统统计学方法研究基因-基因、基因-环境交互作用比较耗时、费力、效果也不尽人意,因此借助统计学方法结合数据挖掘技术准确地分析基因-基因、基因-环境交互作用对复杂疾病研究有着重要意义.本文主要针对真实的GAW17数据集作以基因-基因、基因-环境交互作用的分析研究.利用Lasso算法来给GAW17数据集第一条染色体罕见变异基因的数据进行降维,即变量筛选,由此得到了显著的主效应位点变量以及环境变量;然后利用由Lasso算法得到的主效应,在第二阶段分别建立随机森林模型、支持向量机模型,并分别对两模型的参数进行优化,得到了比较显著的基因-基因、基因-环境交互作用;我们进一步对第二阶段建立的随机森林模型、支持向量机模型进行了比较,得到了一系列评价指标,结果显示,支持向量机模型的指标结果均优于随机森林模型.通过与前人已有的研究进行对比,我们发现本文所建立的两个模型...

【文章页数】:54 页

【学位级别】:硕士

【文章目录】:
中文摘要
Abstract
第1章 绪论
    1.1 研究背景及意义
    1.2 国内外研究现状及发展趋势
    1.3 本文的研究内容和方法
第2章 相关知识介绍
    2.1 单核苷酸多态性
    2.2 基因和基因的交互作用
    2.3 基因和环境的交互作用
第3章 交互模型介绍
    3.1 高维线性模型
    3.2 随机森林模型
        3.2.1 决策树算法介绍
        3.2.2 随机森林模型介绍
        3.2.3 变量重要性评分
    3.3 支持向量机模型
        3.3.1 线性可分
        3.3.2 线性不可分
第4章 数据预处理
    4.1 GAW17数据介绍
    4.2 GAW17数据整理
第5章 GAW17中复杂疾病数据的交互作用分析
    5.1 模型建立及其数据分析结果
        5.1.1 阶段一: 基于Lasso算法的分析
        5.1.2 阶段二: 基于随机森林算法的分析
        5.1.3 阶段二: 基于支持向量机算法的分析
    5.2 方法比较
        5.2.1 混淆矩阵
        5.2.2 ROC曲线
        5.2.3 方法小结
结论与展望
参考文献
致谢
攻读学位期间发表的学术论文



本文编号:4052423

资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/jichuyixue/4052423.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户8e901***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com