前言
R语言是常用的数据分析处理工具之一,尤其是在临床预测模型领域,目前尚无其他语言可替代。虽然一些软件也可进行一定程度的临床预测模型分析,但业内对这些软件的接受程度较低。虽然有一些小众软件可进行临床预测模型分析,但是分析结果完全偏离真实结果,因此笔者不建议各位读者使用R语言之外的软件进行临床预测模型分析。
近年来,随着R语言的逐渐完善,只需要少量代码即可完成各种常用的临床预测模型的构建、评价/比较、验证及可视化。学习本书内容,可在较短时间内完成3~5分的临床预测模型类的SCI,较为迫切地解决了广大读者的燃眉之急。
笔者的使用体会
R语言是开源的,生态完整,有大量的现成数据分析包。R语言在临床预测模型的数据分析领域中是一个理想的工具,有丰富的模型构建、评价/比较、验证、可视化的代码,整合了多种形式的预测模型,可处理高维大数据,开发方便、快捷,且可将模型转换成应用程序或网页,更加高端地展示学术成果。
Rstudio是R语言的一种免费的集成开发环境。相对于在文本文件中编写R语言代码,Rstudio调试代码更加方便,对新手更加友好。Rstudio支持Markdown,可以较为容易地编辑代码文档。利用Rstudio可以很好地记录数据探索分析的过程,便于回顾、修改。
本书的特色
● 从零开始:从模型构建开始,详细介绍模型构建的变量筛选方法,入门门槛低。
● 版本新颖:书中的大部分软件包采用官网的最新版本(截至本书撰写时)进行讲解。
● 经验总结:全面归纳和整理作者多年的R语言临床预测模型培训教学实践经验。
● 内容实用:结合大量案例进行讲解,并对实现同一结果的多种代码进行对比。
本书的内容
本书可以分为三部分:第一部分是预测模型的构建,第二部分是预测模型的评价/比较,第三部分是预测模型的验证。
第一部分主要介绍线性回归、Logistic回归、Cox回归、竞争风险模型的构建,以及常用的变量筛选方法,如先单后多、逐步回归、Lasso、随机森林、最优子集、主成分分析等。另外,本书对拟合模型中的常用统计指标均进行深度解读,如OR、HR、sHR等指标。
第二部分主要介绍如何进行模型的评价/比较,涉及多种形式的列线图、Calibration校准曲线、ROC曲线、DCA曲线等的绘制,不仅涉及单模型的可视化,也包括单模型多时点、多模型同时点的可视化;模型评价指标涉及C指数、AUC、NRI、IDI等。
第三部分主要介绍模型验证,涉及简单交叉验证、K折交叉验证、留一法交叉验证及Bootstrap。
本书读者对象
● R语言零基础入门人员;
● 医学类院校本科生、硕士研究生、博士研究生;
● 高校及医疗机构科研人员;
● 培训机构讲师;
● 对临床预测模型感兴趣的人员。
作者
2022年7月
说明:文中需扫码阅读的请扫此付费二维码。