一、机器学习及生物医学中应用 | 1.机器学习及生物医学中应用简介 2.数据挖掘 3.机器学习基本概念介绍 4.机器学习特征筛选(PCA、LASSO、RFE) 5.常用机器学习模型介绍(LDA、Decision Tree、Random Forest、GBDT、XGBoost) 6.深度学习基本概念介绍 7.深度学习全连接神经网络、卷积神经网络、循环神经网络介绍 8.深度学习框架PyTorch使用 9.ROC曲线及相关模型评估指标 10.生存分析基本概念介绍(生存曲线) 11.预后模型介绍(单因素,多因素cox回归,lasso回归) 12.Python语言简介及NumPy、Pandas、scikit-learn等库的使用 |
二、机器学习在生物医学中的应用案例 | 1.机器学习在生物医学中的应用案例分享 (1)利用机器学习方法筛选疾病相关的生物标志物 (2)利用机器学习方法识别肿瘤良恶性概率 2.机器学习+生存分析预测患病风险 (1)机器学习+生存分析预测患者预后 3.数据挖掘 (1)WGCNA理论和算法 (2)寻找差异基因和制作5年生存率 (3)使用cytoscape寻找核心基因 (4)提取蛋白编码基因 (5)基于算法构建调控 4.TCGA数据库介绍 (1)TCGA数据库下载RNAseq,miRNA-seq数据 (2)TCGA临床数据下载 (3)TCGA数据整理和基因注释 (4)合并TCGA表达谱数据 5.GEO数据库介绍 (1)GEO数据库检索 (2)GEO数据下载 6.Oncomine数据库概述 (1)Oncomine的Meta分析 (2)Oncomine的差异分析和共表达分析 |
三、机器学习应用于TCGA公共数据,复现科研文章 | 1.机器学习应用于TCGA公共数据,复现科研文章 (1)差异表达分析 (2)主成分分析(PCA) (3)火山图,热图绘制 (4)GO和KEGG富集分析,柱形图,气泡图绘制 (5)蛋白质互作用网络 2.生存分析,生存曲线绘制 (1)一致性聚类分析(ConsensusClusterPlus) (2)训练集,测试集拆分 3.Python语言简介 (1)单因素,多因素cox分析 (2)Lasso回归分析 4.风险评估模型构建 5.riskScore计算 6.Nomogram模型构建 (1)时间依赖ROC曲线(Time-dependent ROC) (2)矫正曲线,决策曲线绘制 |
四、机器学习应用于GEO公共数据,复现科研文章 | 1.机器学习应用于GEO公共数据,复现科研文章 (1)差异表达分析 (2)主成分分析(PCA) (3)构建机器学习算法模型(LDA、Decision Tree、Random Forest、GBDT、XGBoost) 2.特征筛选及重要性评估 (1)模型评估(ROC曲线绘制) (2)准确率、精确率、敏感度、特异度等模型评估指标 3.构建Nomogram模型 (1)矫正曲线绘制 (2)决策曲线绘制 4.一致性聚类分析 (1)GSEA分析 |
五、深度学习构建模型 | 1.TCGA公共数据构建模 型2.GEO公共数据构建模型 3.使用卷积神经网络(CNN)识别测序数据中的基因组变异 |
六、辅助课程 | 1.学后交流、微信群、QQ群建立; 2.咨询、合作。专业技术团队深入探讨。 |