用公共数据库发文章已经成为国人发文的重要方式,因为对临床医生来说,临床太忙,科研压力山大,每天在医院里连轴转,没法做实验,收集数据过程繁琐、工作量大,又必须要发与自己科室相关、临床研究类的SCI。缺数据、缺方法、不会统计运用、无人指引?
为什么有些医生的SCI发得那么顺利?
发表论文也有诀窍:充分利用临床公共数据库。
利用公共数据库写论文,已经成为毕业、升职称、年度绩效考核的重要方法。
(一)MIMIC数据库
重症监护医疗信息库是一个免费的大型数据库,其中包含重症患者的临床数据、高分辨率生理数据、死亡数据等健康相关数据。
MIMIC数据库收集了BIDMC 2001年6月至2012年10月ICU收治的53423例成年患者数据和2001年至2008年收治的7870例新生儿重症患者数据。MIMIC Ⅳ数据库在MIMIC Ⅲ的基础上做了一些改进,包括数据更新和部分表格重构,收集了2008至2019年BIDMC收治的超过19万名患者、45万次住院记录的临床数据。
MIMIC数据库包含信息如人口统计学特征、床边生命体征的测量,实验室测试结果,各种操作、药物、影像报告和死亡指标。
MIMIC数据库的主要目标是记录ICU患者的综合医疗信息,而非专门针对某一类疾病,但由于它包含的数据量庞大且覆盖面广,包含了大量癌症患者的相关数据。
(二)SEER数据库
美国国家癌症研究所监测,流行病学和最终结果数据库,简称SEER数据库,美国癌症统计的权威来源。收录了大量的临床肿瘤回顾性研究资料,数据获取便捷并且公开免费,因而深受科研工作者的喜爱,以SEER数据库为数据来源的SCI文章正逐年增长。
SEER数据库收录的肿瘤划分为9类:乳腺、结肠&直肠、其他消化系统、女性生殖、淋巴&白血病、男性生殖、呼吸系统、泌尿系统及其它尚未确定的类型。临床数据记录包括患者的注册编号、人口统计学特征、肿瘤特征、治疗方案、死亡原因等信息。
SEER数据库核心在于其对各种癌症类型的长期跟踪和全面统计,提供了一个多层次的、细致的癌症数据集合。
SEER数据库的数据非常详尽,包括患者的基本信息、肿瘤的诊断信息、治疗方式和随访信息。研究人员可以通过这些数据进行多维度的分析,揭示不同人群中癌症发病率和生存状况的差异,帮助识别出可能的风险因素和预防策略。SEER成为研究癌症流行病学的重要工具。
(三)NHANES数据库
美国国家健康及营养普查数据库,是一项基于全美各层次人群的横断面调查。NHANES数据库提供了所有研究对象的人口学数据、饮食数据、体格检查数据、实验室数据、及问卷调查数据。
NHANES数据库开始于80年代,每年对美国各地约 5000 人进行抽样调查。生物样本包含了参与者的血清,血浆,尿液等,涉及多种测量指标。
NHANES数据库适合大部分临床科室,通过对这些数据的排列组合,足够发很多篇SCI。
NHANES数据库包括人口统计学、社会经济学、饮食和健康相关问题;体检部分包括 基础医疗信息,包括血压,测听检查、口腔健康、握力等等以及大量的实验室检测数据及部分放射科数据。
NHANES 临床数据库几乎适合大部分的临床科室,各大内科、口腔科、眼科、检验科、儿科、妇科、生殖科、肿瘤科、心血管科等。这些数据可以用于研究癌症的流行率、风险因素以及与其他健康指标的关系。
NHANES 数据库拥有庞大的数据资源,并且完全开放免费下载,该数据库包括人口统计学数据、饮食数据、 检查数据、实验室数据、问卷数据、有限访问数据,这个数据库两年更新一次,会加入很多新数据,样本量充足。
中国社科教育培训中心(http://www.cssttcec.org.cn )联合工业与信息化技术培训网(http://www.itcc.ac.cn )特举办“临床科研公共平台NHANES、SEER、MIMIC数据库SCI实战应用培训班”。
一、培训时间:
2024年11月08日— 2024年11月11日 远程在线培训
(第一天数据及操作软件调试,共授课三天)
二、培训目标:
1,掌握MIMIC、NHANES、SEER数据库的统计分析技巧、提升统计学分析和论文写作能力,以及培养实际科研应用能力。
2,通过提供统计学分析和论文写作的套路,帮助学员快速模仿和复现相应的文章,从而提升自己的写作能力,为撰写高质量的学术论文或研究报告打下坚实的基础。
3,培养医务人员利用临床大数据进行临床研究的能力,尤其是实际操作能力。
4,能够熟悉MIMIC、NHANES、SEER数据库的结构、数据字段、以及数据访问方法,从而能够更有效地利用该数据库进行医疗相关的研究,如疾病预测、治疗效果评估等
三、参加对象:
全国三甲医院、医学研究所及高校从事临床医学、生物医学研究的临床医生、副主任医师、主任医师及临床医学博士、硕士研究生;
各科室肿瘤科、神经科、乳腺科、肝胆科、骨科、胃肠外科、血液科、皮肤科、肾内科、免疫科、妇产科、生殖科、心外科、神经内科、感染科、医技科等临床医生。
四、主讲专家:
来自清华大学、上海交通大学、中国科学院等高校医学生物信息学学科带头人、擅长医学数据统计分析、多组学、生物医学大数据挖掘。发表数十篇专业领域内学术论文及SCI论文,主编或参与编写多部著作。参与多家三甲医院临床生物信息学的研究合作,科研及授课经验很丰富。
五、课程大纲
一、临床数据分析科研方法学基础 | 1.常见临床SCI文章类型 2.临床研究分类 3.临床研究统计学基础 4.混杂因素与交互作用 5.临床研究回归分析 6.倾向性评分匹配(PSM) 7.危险因素研究 8.临床预测模型 9.临床工具变量回归 10.广义相加混合模型 |
二、临床数据分析R语言基础 | 1.R语言的数据结构 2.R语言的基本操作 3.R语言中外部数据的导入 4.R语言的基本统计 5.R语言的基础绘图 |
三、MIMIC数据库 | 1.MIMIC数据下载 2.MIMIC 数据提取 3.MIMIC 数据合并 4.MIMIC数据预处理 5.基于MIMIC数据的预测模型构建 6.基于MIMIC数据的机器学习 7.基于MIMIC数据的边缘结构模型 8.基于MIMIC数据的因果中介效应 9.基于MIMIC数据的潜类别分析 10.MIMIC数据库文献解析与实现 |
四、NHANES数据库
| 1.NHANES数据库介绍 2.NHANES数据库权重的选择 3.NHANES数据变量介绍及筛选 4.NHANES数据过滤合并权重处理 5.NHANES数据加权统计分析 6.NHANES数据加权线性回归 7.NHANES数据加权亚组分析 8.NHANES生存数据获取及相关分析 9.NHANES数据敏感性分析 10.NHANES数据库文献解析与实现 |
五、SEER数据库 | 1.SEER数据库简介 2.SEER数据库申请 3.SEER数据库数据提取 4.SEER数据预处理 5.SEER数据PSM 6.SEER数据工具变量 7.SEER数据病例对照 8.SEER数据预测模型 9.SEER数据Joinpoint回归 10.SEER数据库文献解析与实现 |
六、高分SCI论文方法复现实战 (NHANES、SEER、MIMIC数据库) | 1.电子病历数据集的研究热点和趋势分析 2.急性心肌梗死患者预后的预测价值 3.探讨预后营养指数与重症肝硬化患者预后的相关性 4.慢性肾脏病患者血清与全因死亡和心血管疾病死亡的相关性 5.成年人膳食模式与慢性肾脏病的关联性分析 6.探究金属与代谢性疾病的关联及炎症的中介作用 7.抑郁症与骨质疏松症之间的关联研究 8.脂肪指数与脑卒中的潜在关联 9.子宫内膜癌临床病理特征及预后列线图的构建与验证 10.原发肝细胞癌风险模型的建立与验证 11.肾乳头状细胞癌患者术后生存预测模型的开发和验证 |
七、SCI文章写作与投稿 | 1.顶刊SCI的写作 1)Backgroud/Introduction的写法(5个要素) 2)Methods的写法(7个方面) 3)Results的写法(6个分项) 4)Discussion的写法(7个层次) 2.顶刊SCI文章的选题 立题前需要考虑的10个问题 3.投稿建议 1)4个忠告 2)5个档次 |
八、辅助课程 | 1.学后交流、微信群、QQ群建立; 2.咨询、合作。 3.专业技术团队深入探讨。 |
六、课程成果实例图:
七、培训费用:(注:可转账、公务卡扫码支付。正规会议通知、发票。)
A类,每人4300元(含培训费、教材费、证书费、资料费)
B类,每人4980元(含培训费、教材费、证书费、资料费)
八、颁发证书:参加相关培训并通过考试的学员,可以获得:
A类,由中国社科教育培训中心颁发的《医学公共数据库工程师》(高级)专业人才技能证书,官方网站查询,该证书可作为有关单位专业技术人员能力评价、考核和任职的重要依据。
B类,由工业和信息化部全国工业与信息技术考试管理中心颁发的《大数据分析工程师》职业技能证书,官方网站官方网站查询或扫描证书上方的二维码查询,证书直接纳入专业人才数据库,该证书可作为企事业单位选拔和聘用专业人才的依据。(加上A类共两本证书)
注:请学员带两寸彩照两张(背面注明姓名)、身份证复印件和学历证明复印件各两张。
九、联系方式:
联系人: 毛泽璇(老师)
手机(微信同号):13311241619