第一节 医学研究中数据管理
研究人员按照研究设计的具体要求,获得准确、完整、可靠的原始数据。如果获得的原始数据不够准确或不完整,会给资料的整理和分析工作带来很大的困难,再高级的统计方法和统计分析软件,也不能得到真实可靠的研究结果,甚至会得到完全错误的结论。根据不同研究目的和研究内容,数据的来源可以是住院或门诊患者、健康人、动物以及细胞等。
数据管理包括数据获取、数据整理和数据储存三个部分。
1.数据获取
数据获取是数据管理的第一步,它是按照研究设计的要求,用较少的人力、物力、时间获取原始数据。数据的获取有直接观察法和采访法两种,直接观察法是由研究员对实验对象进行直接检查、测量、观察来获取得数据。取得的资料比较真实可信,能保证有较高的应答率。采访法是采用访问、信访、电话调查和开调查会来获取得数据。医学数据主要来源于三方面:
(1)统计工作报表和报告卡:
由医疗卫生机构根据国家的卫生制度和相关规定逐级上报的统计报表和报告卡,如法定传染病报表、恶性肿瘤报告卡等,比较全面地记录了居民健康状况和医疗卫生机构的工作情况,内容较真实、可靠,但是也存在漏报、错报等现象。
(2)常规保存的工作记录:
如医疗部门的门诊记录、住院病历、化验和检查报告单,卫生防疫部门的疫苗接种情况和经常性的卫生监测,计划生育部门和妇幼保健院的出生缺陷登记和孕产妇女健康记录,公安系统的出生登记和死亡登记,企事业单位职工的常规健康档案,保险部门的健康和疾病记录等。这部分资料和统计工作报表一样,往往比较容易获取,省时、省力,但是其真实性和可靠性更差,而且因为不是为专门研究所搜集,所以有时会给资料的整理和分析工作带来诸多不便。
(3)专项调查和实验研究资料:
是指为了解决某个或某些医学科研问题而专门进行搜集的资料,比如为了解某地一般人群的帕金森病的患病情况而搜集的资料,由于目的明确,所以这些资料比统计工作报表和常规保存的工作记录真实、完整,有利于进一步的整理和分析,但是为了某项研究而专门进行资料的搜集,往往要耗费一定的人力、物力、财力和时间,实施起来比较困难。
2.数据整理
数据整理就是根据研究的目的将原始数据进行汇集、排序、分组、合并,如产生亚组、中间变量、新的指标等工作,使分散的数据条理化,系统化。数据整理时要十分小心,不应在整理中出现错误,产生过失误差。数据管理主要是为资料的进一步分析做准备。数据管理主要包括以下内容:
(1)原始数据的人工检查、核对:
在资料的搜集过程中,可能会出现漏项、记录差错等。将数据资料输入计算机前,应由调查员本人或专门人员进行仔细的检查、核对,以保证资料正确无误。
(2)输入计算机、建立数据库:
数据资料经编码分类后,由录入人员将其输入计算机,建立数据库。可以直接在统计分析软件中建立数据库。
(3)对数据库资料进行计算机检查:
可以利用数据库软件或统计分析软件对资料进行专业检查和逻辑关系检查,比如通过编写计算机程序,把身高低于1m的成年人、文化程度是文盲或小学的中学教师的资料找出来,查明是数据录入错误还是原始资料记录有误。
在进行人工检查或计算机检查发现有可疑数据时,不要盲目地更改,应该进行认真的核实,比如某位70多岁的农村老年人月收入是50万,要找到调查员和调查对象本人进行核实、确认,而不能凭自己的主观判断进行修改。
3.数据储存
数据储存是将数据以适当的形式保存,如原始数据、调查表、数据记录表、病历的集中保存,电子数据以何种形式保存,如硬盘、U盘、光盘等,保存的适当的地方、备份数等,以备将来核对、查阅。同时,要考虑数据的安全性和保密工作。