010-6528-0877 联系我们

英语母语专家为您的论文保驾护航

论文写作技巧系列 | 如何统计解读实验结果

论文写作技巧系列 | 如何统计解读实验结果


如今已没有哪些专业可以完全不涉及统计学思维,绝大多数学科都或多或少需要使用统计……统计学已经从我们日常思维的一个方面发展为无处不在的系统性研究工具……统计学思维认为:我们对世界的观察永远无可能完全准确,总存在某些不确定性。

Rowntree D (1981). Statistics without tears. A primer for non-mathematicians.

 

统计是指收集、处理和解释数据的方法。由于统计方法是科学探索的固有内容,因此我已经在研究设计、方法、结果、图表等数处提及统计。但考虑到统计在多数科学研究中的重要性,有必要专门讲解其使用和表达。

 

在开始研究之前,在初步的研究设计中就应该考虑统计。首先,要考虑你需要收集哪些信息来检验你的假设或解答你的研究问题。研究有个正确的开始非常重要;虽然数据检验错误相对容易弥补,要用另外的样本组重新收集数据或者从同一样本中追加获取变量可就费时费力得多。如果你想检验某种疗法对普通人群的效果,你的样本要能够代表这个群体。如果比较的是分别有两种疾病或行为的两个群体,那这两个群体的其他变量如年龄、性别、种族需要尽可能一致。这些涉及的都是数据收集;如果在这一步就犯了错,你就有可能遇到严重的问题,甚至可能会在数个月后在同行审稿阶段遭到严重质疑而推翻重来。

 

其次,你要考虑要采用何种统计检验才能从数据中提炼出有意义的结论。这取决于数据类型。是用来表达某种标志物存在与否的分类数据吗?还是有具体数值的定量数据?如果是定量数据,是连续数据(测量所得)还是离散数据(计数所得)?例如,年龄、体重、时间和温度都是连续数据因为他们的值是在连续,无限可分的尺度上测量出来的;相反,人和细胞的数目都是离散数据,他们不是无限可分的,他们的值是通过计数得到的。你也需要知道你的数据的分布:是正态(高斯)分布还是偏态分布?这也关系到你该采取何种检验。你一定要知道你收集的是何种类型的数据,这样才能用适宜的统计检验来分析和恰当的方式来表示。下面这个网址提供了选择适宜检验方法的指南,可能会有所帮助:https://www.graphpad.com/support/faqid/1790/

 

最后,需要知道如何解读统计检验的结果。P值(或 t、 χ2 等)代表什么意思?这是统计检验的关键:确定结果到底意味着什么,你能下什么结论?统计能告诉我们某一数据集的集中趋势(如平均值和中位数)和离散趋势(标准差、标准误和百分位间距),从而明确该数据集的分布情况。统计学可以比较(如用t检验、方差分析和χ2检验)两个或多个样本组之间是否有非偶然的系统性差别。如果检验表明无效假设可能性很小,则差别具有显著性。一定要记住,用概率简化差别的“真实性”造成了两种风险,两种都取决于所选取显著性的阈值。第一个是第1类错误,是指本没有显著性差异之处检出了显著性差异。另一个是第2类错误,是指本有显著性差异但由于差别不够大而不能捡出。降低第1类错误的风险就会增加第2类错误的风险;不过这也比下不存在的结论要好。统计学也能给出关联的强度,从而允许从样本组中推断出适用于更广群体的结论。统计学赋予了本身价值有限的结果更多意义,并允许我们用概率下结论,虽然总是存在错误的可能。


实例

节选自《The Journal of Clinical Investigation》 (doi:10.1172/JCI38289; 经同意转载)。


核查清单

1.    在列举数据时,说明使用的是何种参数,如“均值±标准差”(“means±S.D”)。

2.    说明数据分析所采用的统计检验方法。

3.    百分比给出分子、分母,如“40% (100/250)”。

4.    正态分布的数据表示为均值±标准差。

5.    非正态分布数据用中位数和百分位数表示。

6.    给出 p 值 ,如写出 “p=0.0035” 而不要只写 “p<0.05”。

7.    “significant’ 这个词仅用于描述统计学上的显著差异。


作者介绍

Daniel McGowan, PhD, Certified Medical Publications Professional

理文编辑学术总监

曾任《Nature Reviews Neuroscience》副主编