统计分析方法
在日常的咨询中,统计分析方法的仍然是研究者最为困惑的问题之一,如果解决了这个问题,知道了用什么方法后,我们可以在书上或网上查询到大量如何操作的方法。因此小编总结了常用的统计方法选择中的过程,从中总结了几个步骤,供非统计专业的研究者参考。
第一步,看研究目的。
不同的研究目的影响统计方法的选择,研究目的非常繁杂,也不太容易分类,但从对统计方法选择有无影响的角度,我个人把研究目的分成3大类:
1.描述类。此类研究一般是观察某些指标的分布情况,如某种疾病的患病率或者某个指标的水平,管理类研究中经常描述各类人群的构成比等,此类都只做描述,不做统计检验;
2.对比类。也即统计推断类,主要目的是对比几组间的指标差异是否有统计学意义,或者是否高于某个目标值,包括比例的比较、均值的比较和分布的比较等;
3.关联分析类。一般是做几个指标之间的关联,比如一个指标是否随另外一个或几个指标变化,主要包括相关分析和多因素回归分析等。
第二步,看研究设计。
研究设计很大程度上决定了统计分析方法。研究类型也很多,在常用研究设计类,观察性研究的分析方法多相似。基于这个在常见的研究类型中我们将其分为4大类:
1.配对设计类,主要包括自身前后研究、成对的器官或组织,以及个体匹配等,这一类研究因为资料不符合独立的原则,要用配对的假设检验,比如配对样本t检验、相关样本非参数检验、配对卡方检验等;
2.随机对照研究,这类研究的统计分析方法最简单,因为随机分组将可观察到的及潜在的混杂因素都控制了,一般只采用数据描述和单因素分析就可以了。
3.观察性研究,包括队列研究,病例-对照研究和横断面研究,这类研究的一般需要数据描述、单因素分析和多因素分析;
4.诊断研究,这类研究属于一类特殊的横断面研究,会计算灵敏度、特异度、准确度和约登指数等,另外可能做ROC曲线。
第三步,看分组数。
分组数一般分为1组,2组和3组(包含3组)以上。
第四步,看数据类型。
数据类型我们一般分为连续变量和分类变量。
连续变量一般是指可测量指标,如年龄、白细胞数等,一般有单位,也包括由其它连续指标计算得到指标,这类指标依据分布情况又分为正态分布与非正态分布。
分类变量一般是指计数资料,如性别、疾病分型等,一般无单位。分类变量又可分为二分类变量,无序多分类变量和有序多分类变量等。
面对各类统计分析方法,我们在选择时可能还会记不住,我特意为大家做了一个小工具,在小工具中通过几步选择就可以看到你要用什么统计方法了,大家可以点击阅读原文或者扫描下方二维码尝试一下。
工具也只包括了最常用的统计分析方法,对于复杂的回归模型等尚不涉及,如果需要用此类方法,还需要咨询统计专家。工具不完善的地方请大家多提宝贵意见。