时间:2022-04-14 09:41:25
导语:在医学统计论文的撰写旅程中,学习并吸收他人佳作的精髓是一条宝贵的路径,好期刊汇集了一篇优秀范文,愿这些内容能够启发您的创作灵感,引领您探索更多的创作可能。
摘 要:统计学方法应用正确与否直接关系到医学科研结果的可信度和有效性,在研究设计时的错误应用会否决整个科研研究方案,基于错误统计学方法上产生的结果会浪费科研人员的时间和精力。编审人员应该高度重视医学论文的统计学方法应用,提高单篇文献的质量和学术水平。
关键词:统计学方法;医学论文;解析
一、引 言
医学由于其研究的复杂性和系统性,常需要应用严谨的统计学方法,由于有些作者对医学科研的统计学理论和方法的应用缺乏深刻了解,在医学论文中错误应用统计学方法的现象时有发生。统计学方法应用的错误直接导致统计结果的错误。例如统计学图表、统计学指标、统计学的显著性检验等。因此,正确应用统计学方法,并将所获得的结果进行正确的描述有助于单篇论著的质量提高,现将医学论文中统计学方法应用及其常见结果的错误解析如下。
二、医学论文统计学方法应用概况
医学论文的摘要是全文的高度浓缩[1],主要由目的、方法、结果、结论组成。一般要求要写明主要的统计学方法、统计学研究结果和P值。一篇医学论文的质量往往通过摘要的统计学结果部分就能判断。统计学方法的选择和结果的表达直接影响单篇论著的科研水平。
(一)材料与方法部分
正文中,材料与方法部分必须对统计学方法的选择、应用、统计学显著性的设定进行明确说明。通过对统计学方法的描述,读者应该清楚论著的统计学设计思路。材料部分要清楚说明样本或病例的来源、入组和排除标准、样本量大小、研究组和对照组的设定条件、回顾性或者前瞻性研究、调查或者实验性研究、其他与研究有关的一般资料情况,其目的是表明统计学方法应用的合理性和可靠性,他人作相关研究时具备可重复性。方法部分应详细叙述研究组和对照组的不同处理过程、观察的具体指标、采用的测量技术,要具备可比较性和科学性,
方法部分还要专门介绍统计分析方法及其采用的统计软件。不同的数据处理要采用不同的方法,必须清楚的说明计数或者计量资料、两组或者多组比较、不同处理因素的关联性研究。常用的有两组间计量资料的t检验,多组间计量资料的F检验,计数资料的卡方检验,不同因素之间的相关分析和回归分析。有些遗传学研究方法还有专门的统计学方法,要在这里简要说明并给出参考文献,还要简单叙述统计方法的原理。统计学软件要清楚的说明软件的名称和版本号,如基于家系资料研究的FBAT1.7.3版本。
(二)论文结果部分
论文结果部分要显示应用统计学方法得到的统计量[2],所采用的统计学指标较多时,往往分开叙述。分组比较多时还要借助统计图表来准确表达统计结果。对于数据的精确度,除了与测量仪器的精密程度有关外,还与样本本身的均数有关,所得值的单位一般采用紧邻均数除以三为原则。均数和标准差的有效位数要和原始数据一致。标准差或标准误差有时需要增加一个位数,百分比一般保留一个小数。在统计软件中,分析结果往往精确度比较高,一般要采用四舍五入的方法使其靠近实验的实际情况,否则还会降低论文的可信度和可读性。
结果部分的统计表采用统一的“三线”表,表题中要注明均数、标准差等数据类型。表格中的数值要按照行和列进行顺序放置,要求整齐美观,不能出现错行现象。要明确标注观察的例数,得到的检验统计量。统计图可以直观的表达研究结果,如回归和相关分析的散点图可以显示个体值的散布情况。曲线图表达个体均值在不同组别随时间变化的情况或者不同条件下重复测量的结果。误差条图由均数加减标准误绘出,描述的是67%的置信区间,不是95%,提倡在误差条图采用95%的置信区间。
关于统计量,一般采用均数与标准差两个指标,均数不宜单独使用。使用均数的时候要明确变异指标标准差或者精确性指标标准误。关于百分比,分母的确定必须要符合逻辑,过小的样本会导致分母过小而出现百分比过大的情况。百分率的比较要写清两者中不同的变化,可以采用卡方检验。
1.假设检验的结果中,常见只写P值的情况,有时候会误导读者,也会隐藏计算失误的情况,因此写出具体的统计值,如F值、t值,可以增强可信度。对于率、相关系数、均数这类描述统计量,要清楚写明进行过统计学检验并将结果列出。P值一般取0.05与0.01作为检验显著性,对于结果的计算要求具体的P值,如P=0.23或P=0.02。
2.在对论文进行讨论时,作为统计学方法产生的结果往往要作为作者的主要观点支持其科学假设,对统计结果的正确解释至关重要。P值很大表明两组间没有差别属于大概率事件,P值很小表明两组间没有差别的概率很小。当P
变量间虚假的相关关系与变量随时间变化而变化相关,统计学意义的关联并不表示变量间一定存在因果关系。因果关系的确定要根据专业知识和采用的研究方法的不同来考量。使用回归方程进行分析,当两变量间具有显著性关系,但是从自变量推测因变量仍然不会很精确。相关或回归系数不能预测推测结果的精确程度,而只是预测一个可信区间。诊断性检验应用于人群发病率很低的疾病,灵敏度、特异度的高低对于明确疾病诊断并不能很肯定。“假阳性率”与“假阴性率”根据实际的需要不同要求并不一致,在疾病患病率很低时,出现假阳性也是正常的,要确诊疾病必须要与临床症状体征相结合。因此,这两个率的计算方法必须交待清楚。
三、医学论文统计学方法应用的常见错误分析
(一)“材料与方法”中的统计学方法应用的常见错误
“材料与方法”中统计学方法常见的问题主要为:对样本的选择或者研究对象的来源和分组描述很少或者过于简单。例如,临床入组病例分组只采用简单的随机分组,未描述随机分组的方法,未描述是否双盲双模拟,未设置空白对照组,分组后对性别、年龄、文化程度的描述未进行统计学检验,对于特殊的统计学方法没有详细交代;动物实验分组的随机化原则描述过于简单,没有具体说清完全随机、配对或分层随机分组等;统计分析方法没有任何说明采用的分析软件,有的只说明采用的分析软件而不交代在软件中采用的统计方法;没有说明原因的情况下出现样本量过于小等情况。
(二)“结果”统计学方法应用的常见错误
1.应用正确的统计学方法出现的结果表达并不一定正确。例如前文所述数据的精确度要求。医学论文常见错误中包括均数、标准差、标准误等统计学指标与原始数据应保留的小数位数不同;对于率、例数、比值、比值比、相对危险度等统计学指标保留的小数点位数过多;罕见疾病的发病率、患病率、现患率等指标没有选择好基数,导致结果没有整数位;相关系数、回归系数等指标保留的小数位数过多或者过少;常用的一些检验统计量,如F值、t值保留的位数不符合要求。
2.对统计学指标进行分析和计算时,一般采用计数资料和计量资料进行区分。计量资料常用三线表,在近似服从正态分布的前提下采用均数、标准差进行说明,如果不符合正态分布时,可以采用加对数或其他的处理方式使其近似正态分布,否则只能采用中位数和四分位数间距等指标进行描述。医学论文中常见未对数据进行正态分布检验的计算,影响统计结果的真实性和可信度。对于率、构成比等常用的计数资料指标,常见样本量过小的问题,采用率进行描述会影响统计结果的可靠性,采用绝对数进行说明会显得客观一些。还有一些文献将构成比误用为率,也是不可取的。
3.在判断临床疗效之一指标时,两组平均疗效有差别并不意味着两组的每一个个体都有效或无效,必须通过计算有效率进行计算。如比较某药物治疗糖尿病的疗效,服药一周后,研究组和对照组的对血糖降低值分别为6.7 ±2.4 和1.2 ±0.6 ( P = 0.000 1) 。按空腹血糖值低于7.7mmol/L的疗效判定有效率,研究组和对照组的有效率分别为75.6%和12.4% ,尽管平均疗效相差较多,但也要注意到该药物对部分患者无效(24.4%)。对假设检验结果的统计学分析结果,P 值的表达提倡报告精确P值,如P = 0.015或P = 0.321等。目前的统计学分析软件均可自动计算精确的P 值。例如常用的SAS,SPSS等,只要提供原始数据,就可以计算出t值、F值和相应的自由度,并可获得精确的P值。
四、小 结
提高医学论文中统计学方法的使用质量是编辑部值得重视的一项长期而又艰巨的工作[3],医学论文中统计方法应用和统计结果的表达正确与否,不仅体现了论文的科学性和严谨性,而且对于提高期刊整体的学术质量,促进医学科学的发展和传播也有着重要作用[4]。
摘 要:统计学方法应用正确与否直接关系到医学科研结果的可信度和有效性,在研究设计时的错误应用会否决整个科研研究方案,基于错误统计学方法上产生的结果会浪费科研人员的时间和精力。编审人员应该高度重视医学论文的统计学方法应用,提高单篇文献的质量和学术水平。
关键词:统计学方法;医学论文;解析
一、引 言
医学由于其研究的复杂性和系统性,常需要应用严谨的统计学方法,由于有些作者对医学科研的统计学理论和方法的应用缺乏深刻了解,在医学论文中错误应用统计学方法的现象时有发生。统计学方法应用的错误直接导致统计结果的错误。例如统计学图表、统计学指标、统计学的显著性检验等。因此,正确应用统计学方法,并将所获得的结果进行正确的描述有助于单篇论著的质量提高,现将医学论文中统计学方法应用及其常见结果的错误解析如下。
二、医学论文统计学方法应用概况
医学论文的摘要是全文的高度浓缩[1],主要由目的、方法、结果、结论组成。一般要求要写明主要的统计学方法、统计学研究结果和p值。一篇医学论文的质量往往通过摘要的统计学结果部分就能判断。统计学方法的选择和结果的表达直接影响单篇论著的科研水平。
(一)材料与方法部分
正文中,材料与方法部分必须对统计学方法的选择、应用、统计学显著性的设定进行明确说明。通过对统计学方法的描述,读者应该清楚论著的统计学设计思路。材料部分要清楚说明样本或病例的来源、入组和排除标准、样本量大小、研究组和对照组的设定条件、回顾性或者前瞻性研究、调查或者实验性研究、其他与研究有关的一般资料情况,其目的是表明统计学方法应用的合理性和可靠性,他人作相关研究时具备可重复性。方法部分应详细叙述研究组和对照组的不同处理过程、观察的具体指标、采用的测量技术,要具备可比较性和科学性,
方法部分还要专门介绍统计分析方法及其采用的统计软件。不同的数据处理要采用不同的方法,必须清楚的说明计数或者计量资料、两组或者多组比较、不同处理因素的关联性研究。常用的有两组间计量资料的t检验,多组间计量资料的f检验,计数资料的卡方检验,不同因素之间的相关分析和回归分析。有些遗传学研究方法还有专门的统计学方法,要在这里简要说明并给出参考文献,还要简单叙述统计方法的原理。统计学软件要清楚的说明软件的名称和版本号,如基于家系资料研究的fbat1.7.3版本。
(二)论文结果部分
论文结果部分要显示应用统计学方法得到的统计量[2],所采用的统计学指标较多时,往往分开叙述。分组比较多时还要借助统计图表来准确表达统计结果。对于数据的精确度,除了与测量仪器的精密程度有关外,还与样本本身的均数有关,所得值的单位一般采用紧邻均数除以三为原则。均数和标准差的有效位数要和原始数据一致。标准差或标准误差有时需要增加一个位数,百分比一般保留一个小数。在统计软件中,分析结果往往精确度比较高,一般要采用四舍五入的方法使其靠近实验的实际情况,否则还会降低论文的可信度和可读性。
结果部分的统计表采用统一的“三线”表,表题中要注明均数、标准差等数据类型。表格中的数值要按照行和列进行顺序放置,要求整齐美观,不能出现错行现象。要明确标注观察的例数,得到的检验统计量。统计图可以直观的表达研究结果,如回归和相关分析的散点图可以显示个体值的散布情况。曲线图表达个体均值在不同组别随时间变化的情况或者不同条件下重复测量的结果。误差条图由均数加减标准误绘出,描述的是67%的置信区间,不是95%,提倡在误差条图采用95%的置信区间。
关于统计量,一般采用均数与标准差两个指标,均数不宜单独使用。使用均数的时候要明确变异指标标准差或者精确性指标标准误。关于百分比,分母的确定必须要符合逻辑,过小的样本会导致分母过小而出现百分比过大的情况。百分率的比较要写清两者中不同的变化,可以采用卡方检验。
1.假设检验的结果中,常见只写p值的情况,有时候会误导读者,也会隐藏计算失误的情况,因此写出具体的统计值,如f值、t值,可以增强可信度。对于率、相关系数、均数这类描述统计量,要清楚写明进行过统计学检验并将结果列出。p值一般取0.05与0.01作为检验显著性,对于结果的计算要求具体的p值,如p=0.23或p=0.02。
2.在对论文进行讨论时,作为统计学方法产生的结果往往要作为作者的主要观点支持其科学假设,对统计结果的正确解释至关重要。p值很大表明两组间没有差别属于大概率事件,p值很小表明两组间没有差别的概率很小。当p<0.05,表明差异具有统计学意义。p值与观察的样本量的大小有关联,当样本量小的时候,数据之间的差别即使很大,p值也可能很大;当样本量大时,数据之间的差别即使很小,p值也可能显示有显著性差异。相关系数统计学意义的显著性也与相关系数的大小没有绝对的关联,有统计学意义的样本相关系数可能很小。因此,有统计学差异的描述并不一定意味着两组间差别很大,错判的危险性很大,显著性的检验为定性的结果,结合统计量大小方可判断是否具有专业意义。
变量间虚假的相关关系与变量随时间变化而变化相关,统计学意义的关联并不表示变量间一定存在因果关系。因果关系的确定要根据专业知识和采用的研究方法的不同来考量。使用回归方程进行分析,当两变量间具有显著性关系,但是从自变量推测因变量仍然不会很精确。相关或回归系数不能预测推测结果的精确程度,而只是预测一个可信区间。诊断性检验应用于人群发病率很低的疾病,灵敏度、特异度的高低对于明确疾病诊断并不能很肯定。“假阳性率”与“假阴性率”根据实际的需要不同要求并不一致,在疾病患病率很低时,出现假阳性也是正常的,要确诊疾病必须要与临床症状体征相结合。因此,这两个率的计算方法必须交待清楚。
三、医学论文统计学方法应用的常见错误分析
(一)“材料与方法”中的统计学方法应用的常见错误
“材料与方法”中统计学方法常见的问题主要为:对样本的选择或者研究对象的来源和分组描述很少或者过于简单。例如,临床入组病例分组只采用简单的随机分组,未描述随机分组的方法,未描述是否双盲双模拟,未设置空白对照组,分组后对性别、年龄、文化程度的描述未进行统计学检验,对于特殊的统计学方法没有详细交代;动物实验分组的随机化原则描述过于简单,没有具体说清完全随机、配对或分层随机分组等;统计分析方法没有任何说明采用的分析软件,有的只说明采用的分析软件而不交代在软件中采用的统计方法;没有说明原因的情况下出现样本量过于小等情况。
(二)“结果”统计学方法应用的常见错误
1.应用正确的统计学方法出现的结果表达并不一定正确。例如前文所述数据的精确度要求。医学论文常见错误中包括均数、标准差、标准误等统计学指标与原始数据应保留的小数位数不同;对于率、例数、比值、比值比、相对危险度等统计学指标保留的小数点位数过多;罕见疾病的发病率、患病率、现患率等指标没有选择好基数,导致结果没有整数位;相关系数、回归系数等指标保留的小数位数过多或者过少;常用的一些检验统计量,如f值、t值保留的位数不符合要求。
2.对统计学指标进行分析和计算时,一般采用计数资料和计量资料进行区分。计量资料常用三线表,在近似服从正态分布的前提下采用均数、标准差进行说明,如果不符合正态分布时,可以采用加对数或其他的处理方式使其近似正态分布,否则只能采用中位数和四分位数间距等指标进行描述。医学论文中常见未对数据进行正态分布检验的计算,影响统计结果的真实性和可信度。对于率、构成比等常用的计数资料指标,常见样本量过小的问题,采用率进行描述会影响统计结果的可靠性,采用绝对数进行说明会显得客观一些。还有一些文献将构成比误用为率,也是不可取的。
3.在判断临床疗效之一指标时,两组平均疗效有差别并不意味着两组的每一个个体都有效或无效,必须通过计算有效率进行计算。如比较某药物治疗糖尿病的疗效,服药一周后,研究组和对照组的对血糖降低值分别为6.7 ±2.4 和1.2 ±0.6 ( p = 0.000 1) 。按空腹血糖值低于7.7mmol/l的疗效判定有效率,研究组和对照组的有效率分别为75.6%和12.4% ,尽管平均疗效相差较多,但也要注意到该药物对部分患者无效(24.4%)。对假设检验结果的统计学分析结果,p 值的表达提倡报告精确p值,如p = 0.015或p = 0.321等。目前的统计学分析软件均可自动计算精确的p 值。例如常用的sas,spss等,只要提供原始数据,就可以计算出t值、f值和相应的自由度,并可获得精确的p值。
四、小 结
提高医学论文中统计学方法的使用质量是编辑部值得重视的一项长期而又艰巨的工作[3],医学论文中统计方法应用和统计结果的表达正确与否,不仅体现了论文的科学性和严谨性,而且对于提高期刊整体的学术质量,促进医学科学的发展和传播也有着重要作用[4]。
1五年制高职医学检验技术专业的学情和岗位需求
医学检验技术专业对从业者的《卫生统计学》知识有较高要求,不仅包括常用统计图表的绘制,常用统计原理、统计方法的理解,还包括检测结果的质量控制和部分多因素分析等。因此《,卫生统计学》是医学检验专业一门重要的必修课。
2高职医学检验专业《卫生统计学》教学改革初探
2.1改革教学内容
2.1.1结合职业岗位需求,精选授课内容:不同的职业岗位对《卫生统计学》知识的需求存在较大差异,教师要对专业岗位需求有清晰的认识,认真研读该专业的人才培养方案,明确该专业对《卫生统计学》知识的整体需求和知识结构。高职医学检验技术专业对《卫生统计学》专业知识的需求主要包括常用统计图表的制作、常用资料的统计描述和统计推断、相关与回归分析等,很少用到多元回归分析、医学科研设计等统计方法。因此,教师要结合专业特点对教材内容进行合理的梳理和筛选。
2.1.2强调对基本原理、概念的理解,形成统计思维,避免死记硬背:五年高职学生普遍存在逻辑思维能力差、喜欢死记硬背概念、生搬硬套公式等情况,课前不预习、课后不及时复习,很容易把各种统计分析方法张冠李戴。作为教师,应在讲清《卫生统计学》基本原理和基本概念的基础上,讲清、讲透几种最基本的统计分析方法,逐步培养学生的逻辑思维和统计思维能力。引导学生把学习重点放在掌握统计方法的基本概念和有关公式的应用条件上,让学生对统计内容进行对比、归纳,建立统计知识的整体观。课后让学生及时复习,以满足将来职业岗位的需要。
2.1.3结合统计软件,淡化公式的数理推导和记忆《:卫生统计学》具有理论深奥、概念抽象、数据枯燥的特点,但它不是数学,不像数学那样着重公式的推导、证明、记忆,并通过大量的习题运算来强化公式《。卫生统计学》的主要特点是逻辑性和实践应用性强,最终的教学目的是让学生在理解统计学的基本原理和方法的基础上学会分析问题、解决问题。合适的统计软件能使复杂的统计过程简单化,更容易激起学生学好《卫生统计学》的兴趣。利用统计分析软件,如SPSS等,使学生在学习统计学时不再拘泥于繁杂的计算过程,而是更加注重统计方法的实际应用,让学生能根据资料的类型,利用软件选择合适的统计分析方法,熟练地进行数据分析,同时也培养了学生对统计软件的操作使用能力。
2.2改革教学方法
2.2.1密切结合医学实例,强调应用能力的培养《:卫生统计学》是一门教师难教、学生难学的应用型学科,多数同学由于对医学检验技术专业的认识不够,不能深刻认识《卫生统计学》的重要性,导致缺乏学习兴趣。传统的教学方法多以教师讲授为主,辅以实习、案例讨论。课堂上教师先讲解基本概念、原理、公式和计算等,然后让学生采用手工法计算相应的统计指标,结果是繁琐的计算使学生对统计学这门课程越来越不感兴趣,对所学的内容似懂非懂,遇到具体问题时无所适从《。卫生统计学》授课时应采用多种教学方法,如PBL教学法、实践教学法、应用教学法等,通过应用统计软件、分析案例避开繁琐的运算,着重培养学生使用统计学这一工具分析问题、解决问题的能力。采用多种教学方法不仅课堂气氛活跃,师生交流多,学生印象深刻,还能充分调动学生学习的积极性、主动性和创造性。
2.2.2适当拓展课本知识:适当拓展对数据量较大的资料的整理和分析能力训练,如不同数据库之间的数据如何相互转换、导入,不同形式录入的数据如何整理分析,如何选用正确的统计分析方法等。只有通过具体的资料分析、统计方法的应用训练,才能让学生充分掌握理论知识,形成统计思维。
2.3改革教学评价的方式
2.3.1注重从结果性评价到过程性评价:高等职业教育的目的主要体现在应用性和操作性上,为了全面考查学生的知识和能力,务必摒弃简单的以期中或期末考试作为终结性评价的做法。应做到全面评价学生的学习过程和结果,调整考试结构,从基础知识和基本能力两个维度进行测试。基本能力的评价要覆盖课堂考核、课后考核、课前预习、知识掌握、灵活应用程度等方面,以全面考查学生对《卫生统计学》基础概念、基本原理和基本方法的掌握程度,以及对具体案例的统计分析能力。
2.3.2从知识评价的单一体系向知识、能力、应用分析等多元评价转变:目前,多数《卫生统计学》教材和各院校开设的《卫生统计学》课程依然使用传统的教学模式,注重理论知识、公式的推导、运算,很多时间花费在讲解基本原理和具体公式上,导致最终的考核评价主要侧重于理论知识的掌握程度,而较少侧重对于统计思维的养成、具体案例分析能力的考核。为此,对于《卫生统计学》考核的具体评价应该包括课堂知识的掌握、课后的总结归纳、统计软件的应用、具体的案例分析等多元评价。
2.3.3注重学生对老师的评价,反馈于教学(多元评价主体,多元评价客体):评价主体应多元化,不仅教师对学生进行评价,而且应该包括学生对教师授课内容、授课方法、授课过程中的亮点与不足等进行的定期评价,以期对教师改进教学方法、提高教学效果起到推动作用。
3结语
综上所述,五年制高职医学检验技术专业《卫生统计学》课程改革,应通过对教学内容的优化、教学方法的改进、教学评价的更新,使本课程更贴近医学检验技术专业岗位能力的需求。学生在掌握了《卫生统计学》基本概念、基本原理和基本方法的基础上,能够根据实际问题选择合适的统计方法,并提高他们对文献的阅读理解能力,形成严密的统计思维。
作者:张玉领 陈培 王季茹 许国莹 单位:淮阴卫生高等职业技术学校
1统计学应用中存在的常见问题
1.1单因素方差分析(ANOVA)两两比较误用独立样本t检验单因素方差分析设计3组以上的均数比较,如果总体比较有差异,需进行两两比较,一般用SNK法或LSD法。但部分研究者却将资料进行拆分,应用独立样本t检验进行两两比较,导致第Ⅰ类统计学错误发生率(假阳性率)增加,从而掉进了一个常见的“统计陷阱”,使所得结论可信度大大降低甚至得出错误结论。SNK法与LSD法虽然并非等价,实质是一致的。SNK法一般用于经方差分析结果具有统计学意义时才决定进行的两两事后比较,而LSD法可用于方差分析不足以具有统计学意义时也能进行两两比较[1]。比较两种方法在SPSS的输出结果形式,SNK是“分堆”比较,一目了然,对于组别数较多的研究更为好用,但没有具体P值,而LSD是在进行“两两”比较时,能给出具体的P值。
1.2两两比较时检验水准的重新调定χ2检验或秩和检验3组以上整体比较有差异时,需应用分割法进行两两比较,这时检验水准应由原0.05调定为0.0167,否则会增加第Ⅰ类统计学错误的发生率。特别当P值处于0.0167~0.05时,按照P<0.0167的标准,差异无统计学意义,而按照P<0.05的标准,却有意义,与事实相悖,出现假阳性,很容易得出错误结论。这种分割法有时很保守,当行列表资料分组多且为有序时可用Mantel-Haenszel卡方检验,也称线性趋势检验(testforlineartrend)或定序检验(Linear-by-Lineartest)[2]。统计路径:用SPSS进行计数资料的趋势检验,在输出结果中读取线性关联检验统计量(Linear-by-LinearAssociation,LLA),如P<0.05可得出随着病种级别的升高,检测指标逐渐升高的趋势。
1.3临床诊断试验中的统计学方法应用在临床诊断试验研究中,经常选取单项计量指标或者联合计量指标以诊断某种疾病,若仅用初级统计学方法如t检验、单因素方差分析等往往不能有效挖掘信息,此时应采用受试者工作特征曲线(ROC)对检测结果进行分析评价。ROC曲线分析基本原理是通过诊断界点的移动[3],获得多对灵敏度和误诊率(1-特异度),以灵敏度为纵轴、误诊率为横轴,连接各点绘制曲线,然后计算曲线下的面积,面积越大诊断价值越高。ROC曲线很直观,能根据敏感性与特异性之和最大化原则自动产生最有效的诊断临界点。具体路径可以参考相关统计专著[3]。统计学处理一般描述为:采用SPSS(版次)统计软件分析数据,对单项及联合检测结果作图绘成ROC曲线,计算曲线下面积(AUC)和标准误,其中联合检测结果变量即预测概率由Logistic回归产生(也可以用判别分析得出)。计量资料应用-x±s表示,运用独立样本t检验及单因素方差分析,两两比较采用SNK及LSD法,计数资料采用χ2检验。检验水准为0.05。具体内容可据情而定。
1.4重复测量资料的方差分析误用拆分文件的t检验或方差分析如研究共设3组,每位患者在3个时间点均查某项血指标,部分作者在处理此类数据时,常误将纵向(同一时间点3组的比较)与横向(同组3个时间点的比较)数据均应用拆分文件的t检验或单因素方差分析来处理,结果导致统计学第Ⅰ类错误发生。此组数据实质是重复测量资料,应采用重复测量资料的方差分析。SPSS中的统计路径:数据-分析-一般线性模型-重复度量。研究者可以参考相关书籍进行处理[3]。
1.52×2析因设计及析因方差分析实验是2×2析因设计时,分组有两个因素,A与B,故分组为A、B、O、A+B,这个设计在析因设计研究中很常用,但常会出现分组设计正确,却没有用析因设计方差分析。析因设计与单因素方差分析不同[4],它不但能分析治疗效果中处理因素的单独效应和主效应,还能分析因素间的交互效应,并能提高检验效能。非统计专业的研究者进行析因分析可能稍有难度,可参考相关统计学书籍提供的统计步骤进行此类分析[3]。
1.6Meta分析Meta分析是循证医学系统评价常用的方法[5],应用时需注意统计学处理中计数资料采用比值比(OR)作为效应变量。具体路径:先进行异质性检验,当P>0.05时,认为同质,选择固定模型;P≤0.05时,不同质,此时可采用敏感性分析或分层分析等异质性处理,使之达到同质后再选择固定模型;若采用异质性处理仍未达到同质,则采用随机模型,以上统计路径均需交代清楚。Meta分析的结果是以“森林树”体现的,审校中我们经常遇到作者绘制的“森林树”左上角“文献、对比、结果名称”等内容显示为“?”,这是由于部分版本的RevMan软件不能输入中文,此时可以考虑省去,或用Photo-shop软件添加相应中文。Meta分析作为一种高级统计方法,专业性要求较高,作者可参考循证医学类权威杂志上的文章格式,如《中国循证医学杂志》中“论著•二次研究”栏目的循证文章。
2科技论文中统计学处理的相关表述
2.1资料与方法中具体统计路径的描述“统计学处理”的内容常位于论文资料与方法的最后一段,一般来说包括统计软件名称及版次、统计描述、统计方法、检验标准等内容,亦可细致交待每个表格的具体统计方法。经典例子如下,“统计学处理:采用SPSS(版次)统计软件分析数据。计量资料用均数±标准差表示,采用单因素方差分析,两两比较采用SNK法及LSD法。检验水准为0.05”。上述内容包括了大致的统计方法,即具体的统计路径。此部分内容,没有绝对统一的规定[6]。常见的问题有:统计学方法描述不全、内容过于简单、存在粘贴抄写痕迹等。如部分论文的统计学处理中提及“以α=0.05为检验水准,P<0.05为差异有统计学意义”这句话,这在统计学上实质是一个重复句,保留其一即可。
2.2结果中具体P值的标注现在的统计学处理手工计算的较少,一般均应用统计软件,最常用的软件如SPSS、SAS均能给出具体P值。但部分论文的结果表述中却未标明具体P值,作为科技论文是不够严谨的,建议作者在表述研究结果时注明具体P值,增加论文可信度的同时,可用于再次分析。
2.3表格制作统计表设计需规范,应体现统计设计内容。部分表格存在内容割裂、组别名称违反表格简洁化原则、表下注释繁琐、横标目与纵标目颠倒等情况。建议作者写作论文时参阅相关统计学教程及杂志稿约。医学统计学教学在中国的医学教育特别是高层次教育中举足轻重。一项课题从一个好的创意开始到实施、结题,统计学方法始终贯彻其中。不管是临床试验研究、实验性研究、观察性研究,还是临床测量误差与诊断试验,如果没有规范性的统计设计、精确的统计分析、科学的统计学解释与表述,很难获得学术上的认可[1]。目前在统计学的具体应用中,研究课题开始设计时就有统计学专家参与已成为较流行的趋势。许多专业统计学专家或研究者在不停的进行“统计基础”的研究,以创造更多的数理统计方法。对于非统计专业的研究者来说,统计学的学习主要侧重于应用。在应用统计学教学中,一般分为4个档次或阶段来进行,首先通过学习医学统计学课本获取统计学思想、原理和方法,其次学习统计软件相关书籍掌握数据到统计结果的转化,再学习统计表达与描述书籍达到书写统计学报告能力,最后可以学习如何出具统计审阅报告。医学科技工作者亦可按照这个顺序学习以提高统计能力。
利用文献统计分析学对中国部分地区高校的预防医学、卫生学二级学科科技论文的数量和质量进行逐年统计分析,客观评价高校、学院、学科、个人的医学科研产出的学术水平和影响力,旨在揭示2006-2010年我国相关高校的该学科科研动态,以及5年间全国高校该学科的科技学术水平;按照二级学科进行分析评价,旨在反映高校在各个学科的研究实力与水平,发现各高校的优势学科和研究不足,以寻求稳步发展。
按照《教育部学科门类、一级学科、二级学科目录》,公共卫生与预防医学的二级学科为:流行病与卫生统计学、劳动卫生与环境卫生学、营养与食品卫生学、儿少卫生与妇幼保健学、卫生毒理学、军事预防医学等。笔者对2006年-2010年间我国部分地区高校公共卫生与预防医学二级学科科技论文统计与分析的文献简要评述如下。
目前,国内外对于2006年-2010年期间,我国高校公共卫生与预防医学二级学科的科技论文做的统计与分析比较少,仅有山西医科大学孔瑞珍的学位论文《高等院校公共卫生与预防医学科技论文产出的综合评价》对筛选出的27所高校在2003年—2007年间产出的科技论文,经秩和比法逐年统计分析后得知,北京大学、四川大学、复旦大学、华中科技大学等高校具有较高的论文产出能力,提示这些高校在公共卫生与预防医学学科方面具有较强的科研能力,成绩突出。对27所高校预防医学下属二级学科的科技论文产出数量运用秩和比法统计评价后,得出了在各二级学科方面各大学的科研情况以及优势所在:流行病与卫生统计学以第四军医大学和复旦大学为优,劳动卫生与环境卫生学方面复旦大学和华中科技大学表现突出,营养与食品卫生学是第三军医大学和中山大学名列前茅,儿少卫生和妇幼保健学以华中科技大学和安徽医科大学最强,卫生毒理学突出的是第三军医大学和吉林大学[1]。在进行横向比较后发现,各高校5年间每年的论文产出数量相对起伏不大,但高校在各学科的论文产出能力并不均衡,需要发挥所长,弥补不足,既要全面发展,也应重点突出。
其他文献主要是对以某地区的卫生机构或某一高校的公共卫生与预防医学进行研究,例如:温州医学院图书馆赵丽红的《2002-2007年温州医学院医药卫生科技论文产出的计量分析》一文中应用文献计量学的科学方法,对2002-2007年温州医学院(温医)教师在国内生物医药期刊上发表学术论文及SCIE收录国际论文进行定量研究,提供各项指标的统计数据和测评结果。文中利用中国生物医学文献数据库和美国《科学引文索引》按照论文机构分布、论文作者分布、载文期刊分布、基金资助项目产出论文情况统计分析等,得出2002-2007年间,温州医学院国内发文和SCIE论文量均呈现出显著增长的趋势,在数量上和质量上均有很大程度的提高,但就目前而言,与国内一流医学院校尚存在一定的差距[2]。浙江省医学情报所的舒畅和《移植杂志》编辑部的沈敏共同完成的《浙江省各地区医学科技论文计量分析》一文中用中国生物医学文献光盘数据库(CBMdisc)对浙江省11个省辖市在2002-2007年发表的生物医学文献进行统计,按照11个省辖市的总量、省辖市在核心期刊上发表的文献量、11个省辖市排名前五位的学科等进行统计,根据统计结果对浙江省各地区的生物医学水平进行分析,发现浙江省生物医学水平有长足的进步,但地区发展不均衡的现象十分明显,尤其是省属单位占居了主导地位,市级医疗单位难以与他们竞争,该文对以后这些地区的发展提出了建议。
还有部分文献是仅仅研究公共卫生与预防医学领域的文献计量指标的有关情况,中华预防医学会的刘玮完成的《从期刊的文献计量指标变化看预防医学和卫生学期刊的进步》一文中,从选取的7个主要文献计量指标:总被引频次、影响因子、即年指标、他引总引比、源文献量、基金论文数比、平均引文率等来对2005和2006年全国科技期刊、医药类期刊及预防医学期刊进行了比较。结果表明:78种预防医学期刊的平均指标值稍低于全国期刊和医药期刊。但增长率大部分高于全国和医药期刊,表明预防医学期刊的发展势头较好[3]。
也有不少文献是介绍如何采用文献计量学的方法来应用于医学信息研究,北京协和医学院张雪燕在其硕士论文《医疗机构科研绩效评价研究》中,利用阜外心血管病医院1999-2008年科研活动统计数据库,调查中标课题、获得成果、发表SCI论文、著作、专利等方面的基本情况及发展趋势。采用SAS8.2统计软件描述课题、成果、论文在时间分布、专业分布、人员分布上的变化趋势和特征,并通过建立科研绩效评价体系,运用综合指数法对医院及各专业进行科研绩效评价,全面、客观地评价医院科研工作的发展态势、潜力,为医院制定中、长期科研发展规划提供参考依据,并促进科研管理更加科学化、规范化、合理化。其中的研究方法:一是数据库的建立。(1)科研处建立的课题、SCI论文的Excel数据库:在日常工作中形成。课题库入选的指标有姓名、基金名称、经费、项目类别、科室,入选标准为1999-2008年承担的纵向课题。SCI论文库入选的指标有:姓名、影响因子、科室,入选标准为1999-2008年第一作者发表的文章。(2)人事处的人员信息Excel数据库:在日常工作中采集形成。另有中国医学科学院硕士研究生学位论文入选指标:为姓名、性别、年龄、学位、职称。二是统计分析方法。利用SAS8.2软件进行分析,用描述性统计方法描述研究变量:课题、成果、论文的时间分布、专业分布、人员分布上的变化趋势和特征。三是建立评价体系:通过查阅文献和专家咨询法,以科研绩效考核为总目标;课题、成果、论文、著作、专利为一级指标;课题、成果、专利、论文的类别为二级指标;以课题的级别、成果的级别、论文的形式为三级指标。四是评价方法即综合指数法。综合指数法是将一组指标值运用统计学方法处理转化为综合指数值,以便对不同类别、不同结构、不同计量单位的指标进行综合比较[4]。无论是不同医院同类科室间的横向比较还是同一科室不同时间的纵向比较,多指标综合评价都是一个很重要的方法。指标指数化(f):当各个指标值的数量、性质、单位不同时,不能直接比较,必须将指标值标准化,即指标值指数化(f)。广东省疾病预防控制中心胥秋华在《医学文献计量分析应用的研究》一文中,提及医学文献计量分析的情报功能时,提到文献计量分析为读者提供了一种简便可行的情报信息获取途径;文献计量分析的结果客观地展示了主体事物的发展情况及规律,具有较高的可信度,为管理者的决策提供科学客观的依据;通过对分析结果进行纵向及横向的比较,从对自身的科技产出能力、科研水平进行整体评价,并寻找出影响科研论文数量和质量的主客观因素,与此同时,利用计量指标对一个学科或专业发展以及一个国家、地区、单位甚至个人的科研成果进行评价的需求也迅速增长;文献计量分析的结果可以全面、完整、准确地反映主体事物的真实性,不仅具备有说服力的论点和论据,也显示和揭示了客观事物的发展规律,对科学研究素材的选择具有较高的准确度,主要作用是对这些事物进行客观认知,同时进行前瞻性预测,为科学决策或科学规划提供参考依据。
一、当代大学生心理特点以及医药数理统计课程的特点
1.当代大学生的心理特点。大学生在生理上进一步发育趋于成熟,心理上趋向主动和独立,思维能力迅速提高,抽象思维能力与逻辑推断思维能力获得显著地发展,追求新意,对问题和事物有着独特的见解和认识,从而使他们在精神方面的独立意识较之一般青年更为突出。而且当代大学生的这种强烈的自我意识,迫切需要同学、老师、社会以及自身的肯定,马斯洛的自我实现的需求在当代大学生身上表现得尤为突出。另一方面,当代大学生处在一个社会迅速变迁,科技日新月异,信息高度发达的阶段,使得他们探索问题的好奇心更加强烈,希望能够探索万事万物的真相,但大多数大学生怕吃苦,自制力和耐挫力较差。
2.医药数理统计课程的特点。虽然医药数理统计相对于高等数学等传统数学类课程具有更强的应用性和趣味性,但医药数理统计是建立在随机理论基础上的,对习惯了确定性思维的大学生,如何转换思维模式是一个挑战;医药数理统计方法的应用一方面需要结合学生的学科专业知识,另一方面需要结合软件实现,如何做到数理统计方法、医药专业知识和应用软件三方面的有机结合是医药数理统计教学过程中迫切需要解决的问题;医药数理统计方法的实际应用涉及的知识面较广,难度较大,如何将利用数理统计方法解决实际问题的完整过程简洁又不失生动地展现在学生面前也是一个关键问题。结合当代大学生心理特点和医药数理统计课程的学科特点,急需从教学内容、教学方法及教学激励和评价机制等方面改革当前医药院校医药数理统计教学。
二、医药数理统计教学改革的内容和措施
1.教学内容的改革是《医药数理统计方法》教学改革的基础。认真研究和理解医药院校各专业学生的培养目标,在不破坏学科知识体系的情况下,在突出医药学特色和增加应用性这两个原则的指导下调整知识点,删减陈旧知识,弱化公式推导,增加结合医药学应用的新方法,增加应用型、研究性案例比重,将重点、难点放在医药特色实际应用的案例教学及科学思维方法的培养上,以应用需求为先导,以案例教学为媒介,以实验软件实现为辅助,实现教材内容与企业实际需求以及医药科研的同步更新,提高学生的学习兴趣和积极性。同时教学内容改革是龙头,必将带动其教学方法、考核方法等一系列的改革,为医药特色创新型、应用型人才的培养打下坚实的基础。
2.教学方法改革是《医药数理统计方法》教学改革的核心。通过教学内容的改革,可以使得教学内容能引起学生兴趣,但如何使学生对医药数理统计保持持久兴趣是最大的难题。如何将一时好奇升化为持久的兴趣、理想及自我价值的实现,必须结合当代大学生心理特点,采用实用有效的课堂教学方法。根据当代大学生的心理特点以及医药数理统计课程的特点,案例教学法是非常合适的教学方法。首先教师可以从较新的权威学术期刊,甚至是教师的科研课题里面寻找案例,或者以产学研合作项目为契机,深入了解企业现今最新需求,根据企业提供的基础资料,提炼经典案例。在案例教学过程中由教师把精选的案例展现在学生面前,让他们带着问题去学习相关知识和方法,接下来需要经过思考和讨论提出解决问题的方案,这使课堂变得生动活泼,有利于激发学生的学习兴趣,培养创新能力及分析、解决问题的能力。每个同学都可以提出自己的见解,相互交流,取长补短,教师通过引导、点拨、启迪等方式对学生进行指导。通过案例教学可以增强学生自身对整个案例解决过程的切身体会,让学生精神层面充分感受到参与案例解决的愉悦感和克服困难、解决问题后的成就感,巩固与提高学生个体对医药数理统计持久的兴趣。特别需要强调的是数学概念和方法也要通过案例引入,数学知识产生时,总是伴随着数学家“火热的思考”,但是数学知识以论文、教材的方式呈现出来时,却往往只剩下了“冰冷的美丽”。通过案例引入可以揭示并引导学生去发掘和领会那些“火热的思考”。而学生发掘和领会那些“火热的思考”的能力,就是学习能力的核心,也是创新能力的源泉。
3.教学激励和评价机制改革是《医药数理统计方法》教学改革成功的保障。要达到最好的课堂教学效果必须构建新型人性化学生激励和评价机制。合理完善的激励和评价机制能够更好地激发行为主体的积极性和创造力,体现以人为本。传统的教学评价机制,往往都是通过课后作业及考试来进行的,存在时间上的滞后,虽然在一定程度上能够反映课堂学习的情况,但是对于课堂上学生主体的参与、思考、创新的程度无法做出判断,有可能挫伤学生创造性思维成长的积极性;而奖学金等传统的激励机制往往周期更长,无法及时满足当代大学生急切盼望社会认同和自我实现的心理需求,一定程度上影响了其学习动力。
4.数学建模竞赛等大实践教学是《医药数理统计方法》教学改革的有益补充。把全国大学生数学建模竞赛作为锻炼同学们实际应用能力的第二课堂。数学建模是数学知识和方法与实际问题之间沟通的桥梁,因此数学建模是对学生将数学的知识和方法转化为用数学的能力的检验。可以说数学建模对学生能力的培养是全方位的:它体现在查阅文献资料、分析综合、抽象概括能力的培养,应用能力和评价能力的培养,运用数学工具和计算机以及实践能力的培养,创新精神和创新能力的培养以及组织协调能力培养等。参与数学建模竞赛活动,会极大地拓展学生应用数理统计知识的空间,并会对课堂教学产生良好反馈。要鼓励和指导学生积极参加全国大学生数学建模竞赛和美国大学生数学建模竞赛。除此之外,还要让学生走出去,去做与专业相关的社会调查,去医药企业直接感受医药企业对数理统计知识和方法的需求,并在实际应用之后内化为自身的实践能力!以学生的实际需求优化《医药数理统计》教学内容,以学生为主体设计教学方法,并设计及时、科学的激励和评价机制,以提高当前医药院校《医药数理统计》课程的教学质量!
作者:王秀凤张磊唐小娅黄榕波单位:广东药学院 基础学院数学系基础学院物理系
一、试验设计中的统计学原理
合理的试验设计与统计处理的可信度存在直接联系,研究者在编写医学论文时应对医学研究设计方法进行说明。在进行试验设计时应遵循随机、对照、均衡和重复四大原则。在进行试验设计的时候通常会涉及到研究对象的选择,研究对象的分组及选择合理的检测指标三个方面的内容。医学论文就是通过对样本的研究来进行推断总体,找出其共性,得出结论。因此研究者在选择研究对象时应注意选择样本应具有一定数量,能反映出该事物的规律性特征,但又应注意例数不能太多,以免造成不必要的浪费。其选择的原则就是在保证试验结果可靠性的前提下选择最少的样本例数。研究者在选择样本对象后应对其基本特征进行详细的描述,比如患者的年龄、性别、病理分期、疾病诊断的标准等。此外在试验中所用到的试剂、仪器的型号、规格等都应作出说明,以供读者借鉴和做出判断。选定好研究对象后就要对其进行分组。在进行分组时研究者一般遵循统计学中的“随机分配”、“设立对照”以及“均衡”、“重复”的原则。随机化原则是提高组间均衡性的一个重要手段,也是资料分析时进行统计推断的前提。有对照才有比较,在进行组间比较时,应确定好处理因素与实验效应的关系。均衡性则是要使得对结果产生影响的非处理因素尽可能保持一致,这样才能保证对照的结果让人信服。观察实验效应的指标主要有主观指标与客观指标。正所谓主观指标就是通过问答的方式调查受试者自己判断的主观感受;而客观指标则是通过仪器来检验和测量所得出的结果。在进行试验设计时应选择客观性较强、高灵敏性和精确性的指标。
二、统计学方法的选择
统计学方法的正确选择是直接影响到论文结论可信度的重要依据,因此研究者在编写论文时应注意选择合适的统计学方法。不同的统计学方法应用的范围不同。研究者在编写医学论文时常根据论文研究的目的、资料类型、试验设计的方案、样品大小、水平数、特定条件、数据分布特征以及综合分析等来选择对应的统计方法,同时还要根据专业知识与资料的实际情况,结合统计学原则,灵活地选择。当定性资料正态分布时,研究者一般用均数和标准差来表示统计描述指标;当定性资料不符合正态分布时,则可选用中位数及级差来表示;当定量资料正态分布且组间方差齐时一般选用参数法,反之则选用非参数法。t检验一般适用于小样本(n<50)的定量资料且方差齐的两组数据之间的比较。其特点是在均方差不知道的情况下,可以检验样本平均数的显著性,大样本(n≥50)采用u检验;多个样本均数两两比较则用方差分析,如差异有统计学意义,可采用q检验;Dunnett检验则适用于多个实验组与一个对照组均数的比较。定性资料中,表现为互不相容的类别或属性,分为二分类和多类反应,如治疗结果为显著和好转的人数等,该种资料可选用字检验,大样本(n≥50)时采用u检验。如:患者的治疗结果评定为痊愈、显著有效、好转、无效或死亡。该种资料可选用秩和检验或u检验。总之,不论论文中选用的是哪种统计学方法,都要计算出检验值,然后再根据统计量值来判定P值的大小,结论一般描述为“差异有(无)统计学意义”。
三、常见统计学方法的误用分析及对策
1.统计方法误用。
最常见统计方法误用是对等级资料进行比较时应用秩和检验而误用卡方检验。例如:在评价采取不同治疗方法的两组急性脑血管病患者疗效中,治疗组显著有效、有效、无效三种分型分别为15例、10例、8例,对照组分别为14例、11例、9例。本资料例数较少,应选用等级比较的秩和检验,而有些作者却认为只要是率的比较就可以采用字检验。研究者在选择统计学方法时应根据相应的原则,对文章研究目的、资料类型、样品大小、水平数、数据分布特征等进行综合分析后,再来选择对应的统计方法。
2.选用检验方法错误。
在有些论文中,作者常将本应用方差分析和q检验的误用t检验。t检验一般适用于小样本(n<50)定量资料且方差齐的两组数据之间的比较,而方差分析及q检验主要用于对多个样本均数进行比较,几种不同治疗或处理方法等的同时比较。例如:在讨论中、西以及中西医结合治疗急性脑血管病时,两组患者的年龄、病程、病情严重程度等差别均无统计学意义,比较三组患者的一些指标变化。组间多重比较应用q检验,但文中作者采用的是t检验,对三组均数进行两两比较。这不仅造成了资料的利用率低,也增加了假阳性的概率,降低了试验结果的可信度。
四、结论表述中的统计学应用
在对统计资料进行分析后应把握统计学术语,对结论做出科学的分析跟解释。在根据统计结果得出专业结论时研究者应遵循一个重要原则,就是统计结论都是概率性的,不能绝对地肯定或否定。研究者习惯上将“P<0.05”称为显著性,不应误解为差别很大或者在医学上有显著的价值。统计推断是以一定的概率界值为依据,说明来自同一总体的可能性大小。“差异有统计学意义”说明在试验中的差异不能用抽象误差进行解释;“差异无统计学意义”表明在试验既定的条件下,差异可能是因抽象误差引起的,在增加样本数量的情况下,差异可能变成“有统计学意义”。
作者:李盛荣单位:玉林市医学情报所
1调查对象和抽样方法
采用随机整群抽样的方式,以预防医学系预防医学专业2007级全体学生共101人为研究对象,自行设计问卷对其进行调查,根据计算机产生的伪随机数随机抽取1、2班为实验组,3、4班为对照组。
2教学方法
在理论课教学方式上,实验班和对照班均采用多媒体传统教学。而在实验课程的教学方式上,对照组的实验课程仍旧沿袭以往传统教学模式,即“回顾理论课知识点练习教科书中对应的思考练习题课后复习”,学生被动参与。实验组在实验课程中则以案例讨论分析为核心,学生主动参与为主线的教学模式,即“课前复习理论知识提出案例互动交流分析案例解析教师总结”,通过对典型的案例进行分析,使得同学们有机会运用理论知识对文献中的统计分析方法进行探讨,达到从实践层面上锻炼学生解决问题和分析问题的能力。
3调查方法
教学效果主观层面学生自我评价:根据研究对象和研究目的自行设计调查表,调查内容主要包括个人一般情况、学习效果自我评价、教学改革效果评价以及对实验教学的建议和意见。经预调查后,调查表在实验组与对照组同时统一发放,学生当场填完,经核实无漏项当场回收。本次调查发放问卷101份,回收有效问卷99份,有效回收率98%。教学效果客观层面评价:为客观评价教学改革效果,老师特意命制了具有调查目的的试卷,以期末考试的形式对学生的学习效果进行客观评价。试卷分两部分,前半部分为基础知识部分,后半部分为综合运用部分,满分100分,由同学们在规定时间内独立完成。除两人缓考外,其他所有试卷当场收回,回收率98%。
4统计分析方法
资料经统一编码后实用Epidata3.1软件建立数据库,采用双录入的方法,2人分别录入再进行对比,对数据进行逻辑查错后经整理形成最终数据库,数据分析运用SPSS16.0统计软件包进行包括算数平均数、标准差、等统计描述,以及统计推断如t检验,卡方检验,秩和检验等。
5结果
5.1一般情况比较
本次调查回收有效问卷,实验组49人,对照组50人。两组同学入学前的性别、来源地、户籍构成、和年龄差异均无统计学意义(p>0.05)。提示两组资料人口特征上有可比性,均衡性好。
5.2理论知识认知情况
分析结果显示,实验组与对照组对理论知识的认识情况,包括T检验、方差分、统计图表、直线相关回归、多元线性回归,差异均无统计学意义(P>0.05)。
5.3教学效果自我评价情况
实验组与对照组对教学方法的评价中,交流能力、表达能力、获取信息能力以及解决实际问题的能力方面,差异均有统计学意义(P<0.05),且实验组优于对照组。而学习效率方面,差异无统计学意义(P>0.05)。
5.4期末成绩客观指标
为客观评价教学改革效果,老师特意命制了具有调查目的的试卷。试卷分为两部分,前50分为基础题,题目涉及的知识点比较基础;后50分为实际运用题,需要灵活运用书本知识,难度相对较大。实验组与对照组基础知识部分得分、综合运用部分得分、总分方面,差异均无统计学意义(>0.05)。
6讨论
随着医学科技以及卫生事业的发展,社会对以学生的知识、能力、素质提出了更高的要求,培养医学生的科学素质和科研能力已成为现代医学教育的主要内容,以案例问题分析为基础的教学是顺应教学改革潮流发展起来的一种新的教学方法。通过上述调查,结果显示在不同的实验教学模式下,通过对不同实验教程的教学效果分析,实验组与对照组在对统计学知识认知方面无差异无统计学意义(P>0.05);两组同学在获取知识的能力、表达能力以及交流能力方面,差异均有统计学差异(P<0.05),实验组优于对照组。学习效率方面自我评价,差异无统计学差异(P>0.05);两组同学期末考各方面得分方面,差异均无统计学意义(>0.05)。分析可能原因如下:
(1)学生缺乏学习主动性:
实验教学课程改革的核心是进行案例分析。其前提是需要对书本理论知识要有一的理解。学生由于缺乏主动性,在上实验课程之前,由于很大一部分学生缺乏主动性,没有在实验课之前做好充分的准备和预习,包括收集资料、查阅文献、全面透彻的理解书本知识。致使在实验课程中不能积极的投入到讨论之中。同学们应在课下即使巩固知识,在对书本知识理解的基础上,再进行具体的案例分析,才能融会贯通地提高对书本知识的灵活运用。
(2)学生缺乏学习积极性:
医学统计学理论和系统性较强,章节内容比较枯燥抽象,公式难以辨别和识记,同时同学们的数学演算和推理能力较弱,因此同学们对统计学的认同程度较低,普遍存在畏难和烦躁情绪,案例分析要求每个同学都积极加入到讨论中,同时主动发言,回答相关问题。实验组同学普遍反应压力较大,学习负担重,这样更能激起同学们的排斥情绪。可见,同学们的不良情绪对本次调查结果存在一定的影响。
(3)实验组缺乏课后的巩固练习:
对照组的实验教学模式以课后练习为重心,在理论课程之后,对具体的课后练习题进行解答,这有助于同学们对理解知识的巩固和理解。实验教学采取案例分析为核心的教学方式,但是仅仅通过课堂的短短几十分钟是远远步够的。学好统计学除了需要识记理论知识外,更重要的是学以致用,而适量的课后练习则是通向融会贯通的桥梁。统计学是一门应用的学科,实验教学组同学在案列分析之后,要做适量的练习题巩固知识,这样才能从本质上提高解决问题的综合能力。
7结语
实验教学课程的改革使得学生在交流、表达、获取信息方面的能力得以提高。这主要归功于案例分析给予了同学更多表达自己的机会。同学们畅所欲言,个人综合能力得到锻炼。但是在改革中还存在一定的问题,要想达到预期的目标,除了教学形式的改革,更重要的是要从老师的教学方式和学生的学习方式进行改革,提高学生的积极性、主动性、创造性。笔者认为可以着眼从以下方面进行调整:
(1)实施前老师应该多与学生交流,增强了学习动力和信心。同时同学应在老师的指导下,课前准备更充分些,多让学生望参加现场数据收集工作,增加接触实际工作的机会。在实际工作中带着浓厚兴趣去学习将有助于调动同学们的积极性和创造性。
(2)实施过程中,老师应该加强对学生课后的学习监督。努力把学生的观念从“要我学转变成我要学”,学生学习不够主动,课堂讨论吃力。老师可以定期抽查学生的分析笔记,鼓励学生课外时间多做相关练习,即使深化所学知识。只有内容和形式都有了实质性的变化,学生能够主动积极的投入到实验教学改革中,才能真正从本质上提高学生的综合分析问题,解决问题的能力,才能培养出符合社会需要的实用型人才。
作者:贾贤杰汪一心吴学森朋文佳芈静周占伟单位:蚌埠医学院预防医学系流行病学与卫生统计学教研室
1样本来源和统计方法
1.1样本来源
样本来源于《中国科技期刊引证报告(扩刊版)》(2011版)。由浙江省出版发行的医学专业期刊共有25种,占浙江省科技期刊总数(115种)的1/5。涉及基础医学、内、外科等13个学科,数量最多的为综合类(4种),其次为学报类(3种)。刊期以月刊为主(12种),其次为双月刊(11种),半月刊和季刊各1种。
1.2统计方法
以中国科技期刊引证报告(扩刊版)》(2011版)为数据源,统计25种期刊的影响因子、总被引频次、基金论文比等3项反映期刊影响力的指标进行文献计量学分析。同时,为客观评价期刊的水平,对以上指标用本期刊的指数/学科平均指数来进行纵向的比较,比值>1表明该指标高于学科平均水平。
2结果与分析
2.1浙江省医学期刊影响因子与总被引频次
影响因子是一个相对统计量,它表征期刊有用性或显示度,与期刊影响力、论文质量和学术水平直接关联,是目前公认的衡量期刊尤其是同类期刊影响力大小的最为重要的指标之一。表2显示:浙江省医学期刊总体的影响因子低于全国平均水平,影响因子/学科平均比值>1的期刊仅有5本:中国医学高等教育(2.303),浙江大学学报(医学版)(1.612),护理与康复(1.243),肝胆胰外科杂志(1.203))和中华眼视光学与视觉科学杂志(1.190),其余都在本学科的平均水平之下。从以上结果来看,除了浙江大学学报(医学版)外,其余4本杂志均具有鲜明的专业学科特色,表明专业特色对提升杂志的影响因子具有较大的帮助;而浙江大学学报(医学版)虽为综合类期刊,但其依托浙江大学雄厚的科研背景,使杂志的成长有了有利的环境。总被引频次可以显示期刊被引用和受重视的程度,以及在科学交流中的地位和作用,是评价期刊学术水平的重要指标。浙江省医学期刊中总被引频次均值为1201次/刊,高于全国平均水平(882次/刊),说明浙江省医学期刊在学术交流过程中有一定的地位。但是高于本学科平均水平的并不多,仅有4本期刊:中国高等医学教育(3.659),浙江中医药大学学报(1.581)),浙江预防医学(1.187)和中华急诊医学杂志(1.162)。有学者认为总被引频次与载文量相关,本文总被引频次/学科平均>0.6的13种期刊中只有2种是双月刊,因此浙江省医学期刊整体的总被引频次较高是否与其载文量较多有关,有待探讨。
2.2浙江省医学期刊基金论文比情况
基金论文比在一定程度上体现了科技期刊吸收学科前沿和高质量论文的能力,因此也是衡量期刊论文学术质量的重要指标之一。浙江省医学期刊的总的基金论文比低于全国平均水平,有8本期刊与学科平均比值>1,分别为:中华临床感染病杂志,温州医学院学报,中华急诊医学杂志,浙江大学学报(医学版),中国高等医学教育,中华眼视光学与视觉科学杂志,浙江医学和口腔材料器械杂志。一般来说,高校学报或者由高校主办的杂志依托高等学府,基金来源丰富,拥有较高的基金论文比的几率比较高,本文中除了《口腔材料器械杂志》和《浙江医学》,其余6种杂志均由浙江大学或者温州医学院主办,这2所大学均拥有较雄厚的科研实力。值得关注的是《浙江医学》作为一本地方性的医学杂志,拥有较高的基金论文比,充分说明其在浙江省医务工作者中的地位。
3讨论
3.1浙江省医学期刊的总体评价
目前,期刊的评价指标有10余种,其中影响因子,总被引频次和基金论文比是其中比较重要的指标,虽然这些指标各有局限,但还是能够基本反映期刊的总体状况。本文通过对浙江省医学期刊以上3种指标的统计分析发现:浙江省医学期刊的总体水平偏低,影响力较弱,虽然在学术交流中有一定的作用和地位,但是吸收前沿学科和高质量论文的能力与国内的优秀期刊相比还有待提高,这与浙江省期刊的总体情况相似。但是也不乏亮点,一些期刊如《中国高等医学教育》,浙江大学学报(医学版)等在其自身的学科领域内名列前茅,具有较高的学术质量。
3.2提升浙江省医学期刊影响力的建议
3.2.1找准定位,坚持专业化和特色化
随着生物医学的快速发展,要在国内的众多杂志中占有一席之地,需要找准自身的定位,寻求鲜明的特色和学科优势。从本文结果可以看出,有着自身特色或者学科优势明显的期刊影响力均较强,如《中国高等医学教育》的各项指标名列前茅,这与其是为数不多的医学领域中涉及高等教育的杂志密切相关,独特性和稀缺性导致了高影响力。另外几种具有较高影响力的期刊,除了浙江大学学报,其余几种也都具有明显的“小而精”专业特色。因此,找准适合自身的发展道路,才能在激烈的竞争中立于不败之地,这不仅需要编辑部根据自身的特点制定发展方向,同时也需要管理部门在政策层面上给予引导和支持。
3.2.2探索集约化的发展之路
2011年,原新闻出版总署已明确科技期刊出版体制的改革的”路线图”,期刊的集约化发展已势在必行。国内外的实践证明,集约化有助于提升期刊的核心竞争力,如国内中华医学会的“中华”系列杂志,在医学领域里有着强大的影响力,在浙江省主办的3本“中华”系列杂志中,除了中华临床感染病杂志因办刊时间较短,一些指标略低之外,中华眼视光学与视觉科学杂志和中华急诊医学杂志在本学科领域中名列前茅,充分显示出“中华”品牌较强的竞争力。因此,今后可以结合浙江省医学期刊的特色或者学科特点,逐步整合横向和纵向资源,通过灵活多样的方式,建立具有鲜明特色的浙江医学期刊集群,通过集团优势提升期刊整体的影响力和竞争力,如刊名带有“浙江”的地方性医学期刊,因其强烈的地域特色,普遍存在影响力偏低的现象,而且一些杂志的学科和内容也趋于雷同,这些杂志是否可以尝试联合经营,优化配置,取长补短,通过团队的力量形成有自身特色的品牌集群,进一步带动期刊的整体发展。
3.2.3加快信息化建设,大力发展数字化出版
数字化出版已成为无法阻挡的发展趋势,代表着未来期刊出版的方向。有调查表明:OA出版可切实提高期刊的学术影响力,特别对提高期刊当年的引用率有明显效果。因此抓住了数字化出版的脉搏,也就是抓住了期刊发展的方向。据调查,浙江省科技期刊的数字化建设不容乐观,从目前的情况来看,大多期刊的数字化建设仍依托于国内大型数据网站,均属于浅层网络化阶段。要吸引读者更多的关注,就需要期刊建立独立的网站,或者几个杂志社建立有专业特色的网络平台,进行深层次信息化服务,这样不仅加强了与读者、作者的互动,还可以提供给他们真正感兴趣的、与期刊内容有较强相关性的信息。一个设计良好网站不仅是编辑部与作者、读者良好沟通的平台,同时还能增强作者、读者的“黏性”,吸引他们的关注,提供高质量的论文,从而逐步地提升期刊的质量。
作者:舒畅马凌飞奚莱蕾龚杰周红兵侯翠香单位:国际流行病学传染病学杂志编辑部浙江科技学院学报编辑部浙江气象编辑部
1.统计表达和描述方面存在的错误:(1)统计表中数据的含义未表达清楚,令人费解。(2)统计图方面的主要错误有2个,其一,横坐标轴上的刻度值是随意标上去的,等长的间隔代表的数量不等,在直角坐标系中,从任何一个数值开始作为横轴或纵轴上的第一个刻度值;其二,用条图或复式条图表达连续性变量的变化趋势;(3)运用相对数时,经常混淆“百分比”与“百分率”;(4)在表达多组定量资料时,即使定量资料偏离正态分布很远,仍采用“x珋±s”表达(标准差S>x珋),特别当表中采用标准误Sx珋取代标准差s时,前述的错误很难被察觉出来。
2.定量资料统计分析方面存在的错误:(1)当定量资料不满足参数检验的前提条件时,盲目套用参数检验方法;(2)不管定量资料对应的实验设计类型是什么,一律套用单因素2水平(或叫成组)设计定量资料的t检验或单因素多水平设计定量资料的方差分析。
3.定性资料统计分析方面存在的错误:(1)把χ2检验误认为是处理定性资料的万能工具;(2)忽视资料的前提条件而盲目套用某些定性资料的统计分析方法;(3)盲目套用秩和检验;(4)误用χ2检验实现定性资料的相关分析。
4.简单线性相关与回归分析方面存在的错误:(1)缺乏专业知识,盲目研究某些变量之间的相互关系和依赖关系;(2)不绘制反映2个定量变量变化趋势的散布图,盲目进行简单线性相关与回归分析,常因某些异常点的存在而得出错误的结论;(3)常用直线取代2定量变量之间事实上呈“S形或倒S形”的曲线变化趋势。
5.多因素或多自变量的实验资料进行分析存在的错误:(1)将原本属于多因素实验研究,拆分成一系列单因素的研究来分析,这种“化繁为简、化整为零”的处理,割裂了原先的整体设计,无法研究多因素之间的内在联系或交互作用,容易得出片面、甚至错误的结论;(2)虽然将多个自变量都包括在一个多重线性回归方程或多重Logistic回归方程之中,但整个回归方程没有统计学意义或回归方程中有很多无统计学意义的自变量,就依据这样的回归方程去下结论。
一、统计学方法的种类
医学统计学常用三种类型的资料:计量资料、计数资料、等级资料。计量资料是指通过度量衡的方法,测量每一个观察单位的某项研究指标的量的大小等一系列数据资料,如身高(cm)、体重(kg)、血压(mmHg)等。计数资料是指将全体观测单位按某种性质或特征分组,然后再分别清点各组观察单位的个数。如性别、血型、职业等。等级资料是介于计量资料和计数资料间的一种资料,通过半定量的方法测量得到。如临床疗效、癌症分期等。医学论文中常用的统计学方法有计量资料用t检验、方差分析,计数资料常用卡方检验、确切概率法等,等级资料常用秩和检验、Ridit分析等。当然,有些资料可以相互转换,数量变量可以转换成等级资料,等级资料可以转换成计量资料。那么医学论文中统计学方法使用情况如何呢?王倩等人研究了五种中华医学会系列杂志论著中十年来统计学的应用状况,结果表明,1995年发表的论著较1985年有显著进步,文章中统计分析的使用率从40%上升到60%,使用了更多较复杂的统计分析方法;t检验和联列表分析均为最常用的统计分析方法。最近几年调查显示,近5年国内不同医学核心期刊的统计学使用情况中,t检验占25.9%、方差分析占10%、卡方检验占21%、Fisher概率占1.1%、秩和检验占2.1%、Ridit分析占1.1%。滕洪松等对山东省医学院校学报论著中统计学方法应用状况调查发现,常用的方法是t检验、χ2检验、相关分析和方差分析。许小幸等对2005年1月至2009年12月《临床儿科杂志》共发表的776篇论著统计学使用情况调查发现,方法中提到统计学分析者占73%~85%,实际使用者占87%~90%,两种方法的使用比和多因素分析的使用比在2008~2009年有所上升。而赖娟等人对国内有较高水平两种中华临床医学杂志(《中华心血管杂志》《中华消化杂志》)2005—2006年发表的643篇论著中统计学方法的使用情况进行调查,统计学方法的使用率为86.5%,正确率为82.7%,t检验和列联表分析为常见的统计学方法。认为统计分析方法的使用率和正确率均有明显提高,方法更加多元化,但统计学方法的未用、误用现象仍然存在。
二、常见的统计学错误类型
统计学是衡量统计研究设计是否严谨、资料收集和表达是否正确、统计分析方法选用是否合理、计算和结果解释是否准确的方法。正确应用医学统计学方法是保证论文科学性的主要环节。然而很多调查显示作者正确使用统计学的状况并不乐观,很多作者(特别是临床一线的作者)对统计学知识了解不够,不能正确使用统计学方法,导致论文中统计学的错误较多。有些是科研设计错误;有些是统计方法描述不清,结论欠科学,或统计检验方法应用不正确;还有些则是统计表图不规范。王倩等人调查显示,最常见的问题是文章中仅有P值而所用统计方法不明、用t检验代替方差分析进行多组间的比较。滕洪松等的调查也表明,较常见的统计问题有:只写P值而未注明所用统计学方法,用t检验代替方差分析进行多组均数间的比较,等级资料比较用χ2检验等。沈进等人对8种医学期刊544篇论著的统计学应用情况进行分析,发现136篇论著中有明显的统计学错误,错误率为25.00%。主要错误类型及构成依次为:资料处理方法不当占61.76%,图表错误占14.71%,未作统计学处理占8.82%,率、比混淆占8.82%,其他错误占5.88%。章新生等辨析医学稿件中常见统计学方法误用情况包括两大类,χ2检验的常见误用类型有误用χ2检验替代秩和检验、误用χ2检验替代四格表确切概率法、误用χ2检验替代配对χ2检验、误用χ2检验处理相关性分析;而t检验的常见误用类型有误用两两t检验替代方差分析和q检验、误用t检验替代配对t检验,作者认为误用χ2检验主要是未结合实际情况和统计分析的目的来正确选用统计学方法;误用t检验主要是未充分理解研究资料是否满足参数检验的条件,以及不能正确判断计量资料所对应的实验设计类型。因此,作为科研工作者,应加强学习和掌握最基本统计学分析方法的概念和经典统计学方法的使用要求。另外,有学者对比中文、外文医学期刊论文各388篇在统计学方法使用上的差异,在10种统计学应用错误中,缺检验统计量、缺P值或P值不精确、配对t检验未给出差值的均数和标准差及生存分析未报告中位生存期,这4种错误中文论文的出错率显著高于外文文献。
三、统计学方法的选择
由于统计学对医学科技论文的重要性,而其错用率又比较高,那么该如何正确选择统计学方法?梁明佩等通过自制的统计学审核线路图对医学文稿进行快速审核,首先把握资料的属性,其次理顺文稿的统计逻辑,最后根据统计学公式进行核算,这样就可以较好地掌握三种资料(计量资料、计数资料、等级资料)的统计学问题。王晓瑜等认为在统计学方法的选择上,应针对不同性质的资料,注意参数检验方法的使用范围,选用合适的统计分析方法。对于定性资料分析,不能将χ2检验视为万能工具,而对于定量资料分析也不能将t检验视为万能工具。另外,各种检验方法均有特定的应用条件,应根据设计类型以及变量类型选择相应的统计分析方法,否则将影响论文的学术价值和实用价值。而要选择正确的统计学方法,必须要有一定的统计学理论知识,掌握一定的技巧,有些人虽然接受过系统的医学统计学的学习,但由于传统教学模式的缺陷,不能灵活应用、举一反三,遇到相同问题会处理,稍有变化则束手无策。笔者在参阅相关文献后发现,按照许小幸等的四步骤选择统计学方法比较实用,即明确论文的统计学分析目标(统计描述或统计推断)判断指标性质(定量资料、定性资料或等级资料)判断指标分布类型(正态分布或偏态分布)判断研究设计类型(是两组还是多组,配对还是成组),其所设计的统计学分析常用方法选择树形结构图也让人一目了然,无论是作者撰稿还是编辑审稿,都可以参照这四个步骤来选择统计学方法。总之,以上资料说明医学论文统计学应用总的趋势是:统计学方法的使用率越来越高,使用的种类越来越多、越来越复杂,但误用率也较高。对于作者而言,有必要更加重视统计学的掌握,正确应用统计学方法。而对于编辑而言,应为作者当好把关人,严格对待每一篇论文的统计学,保证论文的科学性、严谨性。
作者:潘明志唐毓金梁明佩凌琼工作单位:广西壮族自治区卫生厅自筹经费科研课题
一、概率分布
概率分布(probabilitydistribution)是医学统计学中多种统计分析方法的理论基础。授课内容一般包括:二项分布、Possion分布、正态分布、t分布、F分布等。
借助概率分布常常可以帮助我们了解生命指标的特征、医学现象的发生规律等等。例如,临床检验中计量实验室指标的参考值范围就是依据正态分布和t分布的原理计算得到;许多医学试验的“阳性”结果服从二项分布,因此它被广泛用于化学毒性的生物鉴定、样本中某疾病阳性率的区间估计等;而一定人群中诸如遗传缺陷、癌症等发病率很低的非传染性疾病患病数或死亡数的分布,单位面积(或容积)内细菌数的分布等都服从Poisson分布,我们就可以借助Poisson分布的原理定量地对上述现象进行研究。
在生物信息学中概率分布也有一定应用。例如,Poisson分布可以用于基因(蛋白质)序列的相似性分析。被研究者广泛使用的分析工具BLAST(BasicLocalAlignmentSearchTool)能迅速将研究者提交的蛋白质(或DNA)数据与公开数据库进行相似性序列比对。对于序列a和b,BLAST发现的高得分匹配区称为HSPs。而HSP得分超过阈值t的概率P(H(a,b)>t)可以依据Poisson分布的性质计算得到。
二、假设检验
假设检验(hypothesis)是医学统计学中统计推断部分的重要内容。假设检验根据反证法和小概率原理,首先依据资料性质和所需解决的问题,建立检验假设;在假设该检验假设成立的前提下,采用适当的检验方法,根据样本算得相应的检验统计量;最后,依据概率分布的特点和算得的检验统计量的大小来判断是否支持所建立的检验假设,进而推断总体上该假设是否成立。其基本方法包括:u检验、t检验、方差分析(ANOVA)和非参数检验方法。
假设检验为医学研究提供了一种很好的由样本推断总体的方法。例如,随机抽取某市一定年龄段中100名儿童,将其平均身高(样本均数)与该年龄段儿童应有的标准平均身高(总体均数)做u检验,其检验结果可以帮助我们推断出该市该年龄段儿童身高是否与标准身高一致,为了解该市该年龄段儿童的生长发育水平提供参考。又如,医学中常常可以采用t检验、秩和检验比较两种药物的疗效有无差别;用2检验比较不同治疗方法的有效率是否相同等等。
这些假设检验的方法在生物实验资料的分析前期应用较多,但由于研究目的和资料性质不同,一般会对某些方法进行适当调整和结合。
例如,基于基因芯片实验数据寻找差异表达基因的问题。基因芯片(genechip)是近年来实验分子生物学的技术突破之一,它允许研究者在一次实验中获得成千上万条基因在设定实验条件下的表达数据。为了从这海量的数据中寻找有意义的信息,在对基因表达数据进行分析的过程中,找到那些在若干实验组中表达水平有明显差异的基因是比较基础和前期的方法。这些基因常常被称为“差异表达基因”,或者“显著性基因”。如果将不同实验条件下某条基因表达水平的重复测量数据看作一个样本,寻找差异表达基因的问题其实就可以采用假设检验方法加以解决。
如果表达数据服从正态分布,可以采用t-检验(或者方差分析)比较两样本(或多样本)平均表达水平的差异。
但是,由于表达数据很难满足正态性假定,目前常用的方法基于非参数检验的思想,并对其进行了改进。该方法分为两步:首先,选择一个统计量对基因排秩,用秩代替表达值本身;其次,为排秩统计量选择一个判别值,在其之上的值判定为差异显著。常用的排秩统计量有:任一特定基因在重复序列中表达水平M值的均值;考虑到基因在不同序列上变异程度的统计量,其中,s是M的标准差;以及用经验Bayes方法修正后的t-统计量:,修正值a由M的方差s2的均数和标准差估计得到。三、一些高级统计方法在基因研究中的应用
(一)聚类分析
聚类分析(clusteringanalysis)是按照“物以类聚”的原则,根据聚类对象的某些性质与特征,运用统计分析的方法,将聚类对象比较相似或相近的归并为同一类。使得各类内的差异相对较小,类与类间的差异相对较大1。聚类分析作为一种探索性的统计分析方法,其基本内容包括:相似性度量方法、系统聚类法(HierarchicalClustering)、K-means聚类法、SOM方法等。
聚类分析可以帮助我们解决医学中诸如:人的体型分类,某种疾病从发生、发展到治愈不同阶段的划分,青少年生长发育分期的确定等问题。
近年来随着基因表达谱数据的不断积累,聚类分析已成为发掘基因信息的有效工具。在基因表达研究中,一项主要的任务是从基因表达数据中识别出基因的共同表达模式,由此将基因分成不同的种类,以便更为深入地了解其生物功能及关联性。这种探索完全未知的数据特征的方法就是聚类分析,生物信息学中又称为无监督的分析(UnsupervisedAnalysis)。常用方法是利用基因表达数据对基因(样本)进行聚类,将具有相同表达模式的基因(样本)聚为一类,根据聚类结果通过已知基因(样本)的功能去认识那些未知功能的基因。对于基因表达数据而言,系统聚类法易于使用、应用广泛,其结果——系统树图能提供一个可视化的数据结构,直观具体,便于理解。而在几种相似性的计算方法中,平均联接法(AverageLinkageClustering)一般能给出较为合理的聚类结果2。
(二)判别分析
判别分析(discriminantanalysis)是根据观测到的某些指标的数据对所研究的对象建立判别函数,并进行分类的一种多元统计分析方法。它与聚类分析都是研究分类问题,所不同的是判别分析是在已知分类的前提下,判定观察对象的归属3。其基本方法包括:Fisher线性判别(FLD)、最邻近分类法(k-NearestNeighborClassifiers)、分类树算法(ClassificationTreeAlgorithm),人工神经网络(ANNs)和支持向量机(SVMs)。
判别分析常用于临床辅助鉴别诊断,计量诊断学就是以判别分析为主要基础迅速发展起来的一门科学。如临床医生根据患者的主诉、体征及检查结果作出诊断;根据各种症状的严重程度预测病人的预后或进行某些治疗方法的疗效评估;以及流行病学中某些疾病的早期预报,环境污染程度的坚定及环保措施、劳保措施的效果评估等。
在生物信息学针对基因的研究工作中,由于借助了精确的生物实验,研究者通常能得到基因(样本)的准确分类,如,基因的功能类、样本归结于疾病(正常)状态等等。当利用了这些分类信息时,就可以采用判别分析的方法对基因进行分类,生物信息学中又称为有监督的分析(SupervisedAnalysis)。例如,基因表达数据分析中,对于已经过滤的基因,前三种方法的应用较为简单。而支持向量机(SVMs)和人工神经网络(ANNs)是两种较新,但很有应用前景的方法。
(三)相关分析
相关分析(correlationanalysis)是医学统计学中研究两变量间关系的重要方法。它借助相关系数来衡量两变量之间的关系是否存在、关系的强弱,以及相互影响的方向。其基本内容包括:线性相关系数、秩相关系数、相关系数的检验、典型相关分析等。
我们常常可以借助相关分析判断研究者所感兴趣的两个医学现象之间是否存在联系。例如,采用秩相关分析我们发现某种食物中黄曲霉毒素相对含量与肝癌死亡率间存在正相关关系;采用线性相关方法发现中年女性体重与血压之间具有非常密切的正相关关系等等。
生物信息学中可以利用相关分析建立基因调控网络。如果将两个不同的基因在不同实验条件下的表达看作是两个变量,相关分析所研究的正是两者之间的调控关系。如采用线性相关系数进行两基因关系的分析时,其大小反应了基因调控关系的强弱,符号则反应了两基因是协同关系(相关系数为正),还是抑制关系(相关系数为负)。
四、意义
生物信息学不仅是医学统计学的研究前沿,更是医学研究由宏观向微观拓展的重要领域,其研究内容已逐渐为多数医学院校的学员了解和熟悉。而如何对新技术产生的生物实验数据进行准确合理的分析,却成为生物信息学研究的主要瓶颈之一。
在医学统计学课堂教学中引入生物信息学实例,而不仅仅局限于常见的医学、卫生领域的例子,将难以理解的统计理论和方法与前沿的生物实例相结合,拓宽了学员的视野,提高了学员的学习兴趣,更可以加深对所学知识的理解;与此同时,使学员掌握了生物实验数据的先进分析方法,扩大了学员的知识面,提高了他们今后开展医学科研工作的能力。
还有一些医学统计学方法目前也逐渐应用于生物信息学研究中,诸如:遗传算法、熵理论等等。但这些方法已经超出了医学统计学课堂教学的范围,我们将尝试在第二课堂或选修课中,作为补充知识进行讲授,供那些学有余力的学员学习交流摘要:生物信息学的蓬勃发展已使医学研究由宏观逐步探索到微观。医学统计学作为一门医学院校的基础课程,其理论和方法在医学研究的新要求下其理论和方法也有了新的发展与应用。将生物信息学知识带入医学统计学课堂教学,介绍医学统计学的新发展,不但能使学员了解到本学科的前沿研究内容,有效地激发学员的学习兴趣,还能使他们掌握生物信息学研究的工具,提高今后从事医学科研工作的能力。
关键词:生物信息学医学统计学课堂教学
一、临床疗效观察的实验设计问题
在各种医学期刊中,半数以上是疗效观察方面的论著。现择其较普遍存在的统计学问题,结合实验设计基本原则加以讨论。
(一)对照与均衡性测定
国内医学期刊有关临床疗效观察的文章甚多,不少杂志刊登了一些事先未设计对照的文章,其结论难以令人信服。如《用柴葛解肌汤治疗上呼吸感染》一文,报道治愈好转率为97.7%,因无对照,无法断定其效果如何,因此,治愈好转率中含有假像。
对照的方法虽有多种,但对照的基本原则是与实验组齐同可比,最好作均衡性测定。
(二)安慰剂与盲法试验
安慰剂与盲法试验是医研(主要是比较性研究)中常用的科研方法,结果准确、误差性小。安慰剂在形、量、色、味等要与实验药物一样,不能给受试者和执行者任何暗示。这种试验就是双盲法试验。但近年来,尚有人用改良的双盲法,此法分两期:第一期(公开期)试验有效者留,无效者弃。有效者进入第二期(双盲试验),以确定疗效是否系安慰剂的作用。在预防效果观察时可采用该法,临床上应用诸多困难,应视具体情况而定。
(三)样本含量与重复原则
没有足够样本的研究结果,是经不起重复试验的,有的论文凭少数病例观实的结果下结论,是不慎重的。如《重症肺炎并发DIC29例》一文,作者观察脑型患者3例,其中死亡一例,就得出“一般脑型病死率高达57%,本组脑型病死率较低,看来及早用肝素阻断DIC过程,对降低脑型病死率可能具有重要意义”的结论。因无对照,结论不可靠。
(四)随机分组与实验设计类型
随机化分组即每个实验对象有同等机会被抽样(分配)到各组去,而不受任何系统因素的影响。常用的实验设计类型有完全随机设计、自身对照设计、交义设计、配偶设计、随机区组设计、拉丁方设计、正文(析因)设计、序贯设计、半数效量实验设计(动物试验),回顾性与前赡性调查研究设计等。科研设计时应根据研究目的要求选择不同类型的实验设计方法,进行相应的统计处理。
(五)诊断与疗效标准——指标设计问题
观察对象应确诊无疑,事先要制订好诊断标准,保证样本的真实性与代表性。疗效判断要有科学的指标,有特异性和定量指标更好。研究记录表格扣记录要完整统一,仪器、试有等要核校,人员要相对稳定,操作及观察方法要严格执行统一标准。
教育是科技进步和经济振兴的基础,在全国上下贯彻落实《中国教育发展改革和发展纲要》《中共中央国务院关于深化教育改革全面推进素质教育的决定》和全国教育工作会议精神的今天,高等教育为适应这一新形式,推进素质教育,培养大批高质量、高素质的各类专门人才已进行着多方面的改革。sO100
众所周知,医学是理论性、实践性很强的学科。医学统计学更是一门既有复杂理论知识,又有丰富应用技巧的医学专业基础课程。它是科研设计、资料的搜集、整理和分析的灵魂,应用于居民健康状况评价、医疗卫生实践和医学科研,涉及基础医学、临床医学、预防医学等多学科领域。其教学内容贯穿于研究设计到论文撰写的全过程。如何适应新形势,迅速推广医学统计学的基础知识,在满足医学科研需要的同时实现医学统计学的自身发展,是医学统计教育面临的重要课题。我国医学统计教育面临的主要问题是:①教学对象的数学基础普遍较差,教学手段落后。②医学研究进一步向宏观和微观发展,信息数据更加复杂化、多元化和大数量化。我们利用多媒体计算机辅助教学CAI系统具备较好的独立性、可参与性与知识的全面、系统性,以及多媒体组合的高效性等诸多优点,解决了上述问题。利用多媒体技术,我们可以让学生做到“所学即所见、所闻即所学”,适当拓宽内容的深度和广度,提高灵活性,大大增强学生的参与感和实践能力,以创造传统教学手段所达不到的效果。同时,还可利用计算机对学生的学习进行评估并决定进度,实现因材施教。
进入21世纪以后,信息技术飞速发展,现代统计工具从计算器发展到计算机为主,能应用相关的统计软件处理医学科研数据已成为必备的能力。否则,一方面有人不懂得选用正确的统计方法,使大量的信息和统计数据得不到有效的利用;另一方面又盲目使用计算机和统计软件,不管是什么研究类型的数据都简单地交给计算机处理,用计算机取代统计,势必造成大量统计方法的滥用和误用。医学研究的许多数据关系到病人的治疗、转归,甚至生死,统计方法的误用会导致严重的论理问题。我们利用计算机、统计软件、多媒体教学课件相结合,使课堂教学摆脱大量的繁琐演算的束缚,在单位时间内讲授的信息量将会大幅度增加。统计学教学不再是数据的罗列和公式的堆砌,而是研究设计的艺术和数据表达的艺术,并使学生体会到统计思维和推理的乐趣。
近年来我们进行了一些改革措施,取得了相应的成果,现总结如下:
一、积极申报院级教学研究立项的课题:
(1)医学统计学多媒体CAI教学系统的研究和应用(2001年)
(2)医学研究生统计学课程教学模式的改革(2002年)
(3)《心理统计学》多媒体课件的制作及题库的构建(2004年)
另外开了《医学科研数据管理与统计分析》选修课
二、进行了一系列的教学改革措施:
(1)教学内容上所进行的改革,具体做到了“四增三减”:减少了目前已无必要讲授的详细手工计算步骤与技巧;减少了复杂的公式推导,改为公式内涵的剖析;减少了部分浅显内容,改为自学或课堂讨论;增加了“实验设计和调查设计”;增加了“医学统计学软件使用”;增加了“多元统计分析”;增加了“医学统计应用错误的诊断”。
(2)在教学手段上进行了以下几方面的改革:建立了医学统计学多媒体CAI教学系统;开设了统计学电脑实验课;开设了“医学统计应用错误的诊断”讨论课。
(3)在考试内容和形式上的改革:着重考核医学统计学综合分析能力以及正确应用统计方法和纠正错误能力。不考死记硬背、公式和定理。
三、发表相关论文:
(1)医学科研论文中t检验误用分析皖南医学院学报2002,21(2)
(2)医学科研论文中x2检验误用分析皖南医学院学报(论文待发表)
(3)皖南地区中学生伤害危险因素的病例对照研究,中华流行病学杂志,2003,24(7)
(4)胆石病病因的临床流行病学研究现代预防医学2001,28(4)
四、编写的教材:
(1)《医学科研方法与临床流行病学》(2003.8,安徽大学出版社)
(2)《预防医学》(第2版)(2003.8,人民军医出版社)
(3)《心理统计学》(2004.8,安徽大学出版社与北京科学技术出版社)
(4)《心理评估学》(2004.5,安徽大学出版社与北京科学技术出版社)
(5)《卫生统计学实习指导》(2003.10,安徽大学出版社)
(6)《流行病学实习指导》(2002.8,中国科学技术大学出版社)
五、成果创新点:
(1)将统计学软件、多媒体教学模式首次引入我院医学统计学教学之中;
(2)将统计思维和科研创造性实践相结合,注重学生科研能力的培养;
(3)改革了医学统计学的教学内容、教学手段、考试方法;
(4)首次在我院学生中开设“医学科研统计应用错误的诊断”讨论形式的教学模式
(5)特别注重教师主导作用与学生能动性统一
(6)编写“医学统计学”相关教材
六、成果应用情况:
(1)已经将改革的内容应用于我院专科生、本科生和硕士生的“医学统计学”;
(2)在本科生和硕士生的教学手段上采用“多媒体CAI教学”模式;
(3)在考试内容已作了相应的改革;
(4)已经将“医学科研统计应用错误的诊断”应用于皖南医学院学报的论文审阅之中。
以上是对近年来“医学统计教学模式改革”的总结,我们突出了“医学统计学教学课件、医学统计学软件和医学统计应用错误的诊断”三方面的教学改革,敬请各位专家评审,不足之处,请多提宝贵意见,非常希望我们的教学成果能得到各位专家的肯定。
摘 要:医学统计在医学论文中占有重要的作用,贯穿论文的始终,决定论文的质量和水平。编辑在审阅医学论文时,对论文的统计资料、统计方法、统计软件、检验水准、统计符号及表达等方面的熟悉熟悉程度对最终论文质量具有较大的影响。本文从编辑角度,浅谈作为编辑应该注意的统计学知识,以供参考。
医学统计学是运用概率论和数理统计的原理、方法,结合医学实际,研究数字资料的搜集、整理、分析和推断的一门学科。医学统计在医学杂志中占有重要的作用,而考查稿件质量则主要从专业水平和统计学分析两个方面进行评价。具有创新性、实用性和先进性是高质量论文的前提,而经准确统计学分析得出经得起时间考验的结论才是保证。
医学论文一般是三段式:第一部分为资料与方法,第二部分为结果,第三部分则是讨论。一篇论文涉及到统计方法学方面的可有以下几个部分:一、科研设计阶段:除专业设计外,还需要统计学设计(即实验设计)。二、数据的搜集、整理阶段,此部分需要作者具有较强的统计学思维。三、数据的分析、推断阶段:需要根据统计资料准确选用统计学方法,根据统计结果挖掘有用信息。另外,在查阅参考文献,阅读国内外最新研究动态时,文章中也会涉及大量数据资料和统计学方法。因此,笔者将编辑对三段式论文审稿时需要注意的统计方法学知识总结如下。
一、资料与方法
1.1统计方法 统计方法一般是论文中最容易出错的地方,统计学方法选择正确与否直接影响论文结论的可信度。因此,研究者在编写论文时应根据统计资料类型和研究目的选择合适的统计方法。资料类型一般分为定性资料(计数或品质资料)、定量资料(计量资料)和等级资料(有序或半计量资料)。定性资料的统计方法一般用x2检验,定量资料用t检验,F检验和非参数检验,等级资料则用非参数检验和其它方法。根据分析的需要,统计资料类型是可以相互转化的,如:血红蛋白量原属计量资料,可转化为计数资料或等级资料。值得注意的是,很多研究者在选择统计方法时,只注重统计资料类型,却忽略了研究目的,因而导致分析结果无法解释研究目的。因此,编辑在审稿时除了要注意统计方法是否准确,还应该注意得出的结论与研究目的是否相符。
1.2统计软件 统计分析软件类型及版本应清楚介绍,常用的统计软件有SAS、SPSS和S-plus等。编辑在审稿中须注意不同版本的统计软件拥有不同的功能,编辑须清楚知道研究者论文中所用的软件版本是否能提供该统计方法。
1.3 统计数据的表达方式 数据的表达方式应根据数据的类型及是否符合正态分布的特点。计量资料是连续性分布的数据,此数据分布应通过集中趋势和离散程度相结合来进行描述。描述数据集中趋势的统计学指标有均数、中位数和众数;描述数据离散程度的统计学指标有标准差、极差和四分位数间距。对于正态分布的资料适宜采用“x ± s”来表示,对于非正态分布的资料宜用中位数和四分位数间距来描述数据。分类资料是对受试者或观察对象的每个类别的计数,通常用百分数或其他比值表示,常用的指标有率和构成比等。值得注意的是,研究者在描述数据时,通常只注重数据类型,而忽略数据是否符合正态分布,导致所有的计量资料都用x ± s来表示。为更准确地反映此数据年龄分布的集中位置,宜采用中位数而不是平均数。如:8例疾病患儿年龄(岁)为1、1.5、1.5、4、3、5、5、11,此组数据的平均数为4,中位数为2.75。
1.4 检验水准 绝大部分医学论文都没有标出检验水准,只在结果部分标出P0.05。检验水准一般设定为a=0.01或a=0.05。
二、结果
论文结果部分,一般用三线表格形式表示统计结果,并用文字对表格进行描述,或只用文字的形式对统计结果进行描述。结果描述不应面面俱到,而是根据研究目的侧重描述。不论论文中选用的是何种统计学方法,建议都给出具体的P值,再根据检验水准来确定结论有无差异,结论一般描述为“差异有无统计学意义”。研究者习惯将“P0.05”描述为“差异无统计学意义”,表明在目前的实验设计情况下,由于抽样误差的原因,如果在增加样本数量,差异可能变成“有统计学意义”。结果解释和表达方面,应清楚说明所用统计学方法的具体名称(如:配对资料的t检验,两因素析因设计资料的方差分析等)、统计量的具体值(如:t=3.04,x2=4.68)。
三、讨论
讨论也是论文的重要组成部分,讨论部分写作的好坏往往决定一篇文章的深度,也是其学术水平的标志。编辑在审阅讨论部分时,应注意以研究结果为依据,根据统计推断结果下结论,说明研究的价值和局限性。如果有把握,研究者可以提出新的假设和进一步研究的建议。值得注意的是,研究者根据统计结果得出专业的结论应遵循一个重要原则,即统计结论都是概率性的,因此不能绝对地肯定或否定。
四、书写格式及规范
作为医学杂志编辑,审稿时,除了注意统计内容的准确性,还应该注意统计的书写格式及规范。统计有统一的书写格式及规范,统计学符号有英文、希腊文、大小写、正斜体之分。按GB/T 3358.1―2009/ISO 3534―1:2006《统计学词汇及符号》规定,常用的医学统计符号应按下述要求表示:① 样本的算术平均值表示为英文小写“x”(中位数用M);② 样本标准差表示为英文小写“s”;③ t检验表示为英文小写“t”;④卡方检验表示为希文小写“x2”;⑤ F检验表示为英文大写“F”;⑥ q检验表示为英文小写“q”;⑦概率表示为英文大写“P”;⑧相关系数表示为英文小写“r”。以上符号均用斜体。
总之,每一类统计分析方法均有其适用的范围和应用的条件,编辑审稿时应注意,研究者的论文设计及资料的类型是否选择恰当的统计分析方法,是否存在盲目套用的情况。同时,还应注意得出的结果和结论是否满足方法设计的要求。
作者简介:谭涛,女,1980年,重庆市卫生信息中心《国际检验医学杂志》编辑部,硕士,讲师,主要从事流行病与卫生统计研究。
摘要:就近年来体育类核心期刊运动医学科研论文撰写中常见的统计学应用误区进行分析,结果发现:①实验分组不合理,受试对象的选取违背同质性原则;②统计方法不合理,多个样本均数比较,错误应用多个t检验代替,误用单因素方差分析处理多因素方差分析;③误判资料类型,从而误用定量资料统计分析方法,两样本率的检验错误用两样本的t检验来代替。
关键词:统计学;运动医学论文;体育类核心期刊
统计学是科学研究的基础,是研究结果科学性、可靠性的有力保障。而论文是研究成果的表达形式,通过论文可展示研究者的科研成果,也便于查阅者的了解、评价和引用。因此,在论文中要完整、准确地进行统计学内容的表述,以展示研究设计的合理性和研究结果的可靠性。但运动医学论文中存在的统计学错误仍相当严重,其中实验设计和统计资料的应用上最为突出。本文介绍论文中出现错误的部分,并对其进行了正确的统计学内容表述,以便供广大运动医学科研工作者参考。
1实验设计方面的问题
1)实验分组不合理。
例1:《有氧健身操结合饮食控制改善代谢综合征患者胰岛素抵抗、血脂、血糖的实验研究》[1]一文中研究对象为:西安市碑林区某社区代谢综合征患者77人年龄40~65(55.35±7.26)岁。按照接诊顺序将入选MS患者随机分为以下2组,综合干预组和对照组。
该文作者所选取代谢综合征患者年龄跨度较大(40~65岁),因为年龄的不同机能的代谢水平有很大的差异性,不能认为他们来自于同一个总体。把他们随机分入综合干预组和对照组参加试验,两组之间的可比性可能很差,其结论的可信度很低;如果,按年龄段分层随机化,组间的均衡性要高得多。
2)受试对象的选取违背同质性原则。
例2:《不同类型休闲活动对老年女性身体机能影响的差异性研究》[2]一文中对成都市老年大学、锦江区老年活动中心,随机选取离退休5年以上,年龄65~75岁之间老年女性为研究对象。并依据她们的年龄段将活动类型分为:为棋牌队、曲艺队、门球队、舞蹈队;测量指标为:血压及脉率,肺活量,椎体骨密度。
从一般的常识可知,经常参加体育锻炼的人有利于其血压及脉率,肺活量、椎体骨密度指标向好的方向发展。原作者所选取的活动类型为:棋牌、曲艺队、门球队、舞蹈。其中棋牌是一种智力游戏和身体运动没有什么关系,而曲艺,门球,舞蹈主要以身体运动为主(曲艺有利于人体的肺活量的提高)。所以原作者在试验设计时违背同质性原则[3]。
在实验设计时一定要遵守3大原则:对照、随机、重复。对照原则:要确定处理因素对实验指标的影响,如无对照是不能说明问题的。实验分组时有处理组和对照组。对照原则要求处理组和对照组除处理因素以外的其他可能影响实验的因素应力求一致(即齐同比较或有可比性)。随机原则:是使每个实验对象在接受分组处理时具有相等的机会,以减少偏性,使各种因素对各组的影响保持一致(均衡性好),通过随机化可减少分组人为误差。这是对资料分析时进行统计推断的前提。重复原则:是指可靠的实验应能在相同条件下重复出来(重现性),这就要求实验要有一定的例数(重复数)。因此,重复的含义是重现性与重复数。重现性可用统计学中显著性检验的值来衡量其是否满意[4]。
2定量资料统计分析存在的统计学错误
2.1多个样本均数比较错误应用多个t检验
例3:《有氧运动对大鼠血糖、血脂和血液凝固功能的影响》[5]一文中,将30只大鼠随机分为3组:对照组、小运动训练组和大运动训练组。对照组大鼠进行自由饮食和自由饮水;运动训练组动物在此基础上给予为期6周的游泳训练。有氧运动(游泳)、运动后2周和运动后4周从眼眶后静脉丛取血,以及实验结束时(运动后6周)断头取血,分别做血糖、血脂和有关凝血指标的测定。用SPSS统计软件对原始数据进行常规数理统计分析,计量资料用均数±标准差描述,显著性检验用t检验,P
这类错误是定量资料分析中最常见的错误,而且是原则性错误,会增加犯第一类错误的概率[6]。案例(原)表1资料为对照组、小运动组、大运动组不同有氧运动时间对大鼠血清LDL水平的影响,原作者用t检验分别对各组均数逐一进行比较。对照组大鼠在实验期间血清LDL水平没有明显变化P>0.05。与对照组相比,小运动组大鼠随着有氧运动时间的延长,血清LDL浓度逐渐降低,至第6周时,差异具有统计学意义P0.05,但与同期(第4周和第6周)小运动组大鼠血清LDL相比,差异具有统计学意义P
在应用t检验和方差分析时要注意它们之间的共性与区别。t检验和方差分析都是对总体(样本)均数的检验。当对两个以上的总体(样本)均数是否存在显著性差异进行检验时,如果用t检验,4个总体(样本)均数则需做c24=6次可能组合的检验。若在α=0.05的显著性水平上检验,则将降低统计结论效度。所以,两总体(样本)均数的检验用t检验,两个以上总体(样本)均数的检验用方差分析。
2.2处理多因素设计定量资料误用单因素设计定量资料的方差分析方法
例4:《不同营养干预对运动性贫血大鼠红细胞及铁代谢指标的影响》[7]一文中,实验目的为:观察补充复方阿胶中药与补充铁剂营养对运动性贫血大鼠红细胞及铁代谢指标的影响。方法:以32只健康雄性Wistar大鼠为研究对象,每只体重约300 g,随机分为4组,C组为安静对照组(n=8),E组为递增负荷跑台运动组(n=8),ENⅠ组为递增负荷跑台运动+阿胶营养补充组(n=8),ENⅡ组为递增负荷跑台运动+铁剂营养补充组(n=8)。然后ENⅠ组和ENⅡ组营养补充4周。实验结束后24h内处死。结论:9周递增负荷跑台运动导致大鼠红细胞相关指标的显著性下降,引起运动性贫血,但血液铁代谢无显著变化;补充4周复方阿胶中药制剂或铁制剂,提高红细胞相关指标,改善大鼠运动性贫血状况。数据统计方法实验数据用SPSS13.0软件中one-wayANOVA处理,结果用均数±标准差表示,显著性水平为P
原文采用单因素设计定量资料的方差分析不合适,仔细考察各处理组之间的关系有:是否递增负荷跑台运动,是否补阿胶营养或补铁剂营养(两者都能促进RBC生成,增加Hb含量的物质,在本研究中可以认为它们是同一因素),原文在固定一个因素于某个水平下观测另一个因素的作用,这种做法割裂了实验设计的整体性。正确的做法是,先从专业角度上分析二个实验因素之间是否存在交互作用、是否存在二个因素有主次之分、是否存在交互作用或交互作用可以忽略不计等情况。也就说对事物的影响只考虑施加了一个条件(因素)为单因素方差分析;如果施加了2个以上的条件(因素)为多因素方差分析。如果是多因素方差分析还要考虑施加的条件(因素)之间有没有联系、有没有主次之分。具体看(原)表2资料,施加了两个条例(因素)即递增负荷跑台运动和补阿胶营养或补铁剂营养,然后考虑两条件(因素)之间的联系,通过分析2个因素间存在交互作用的可能性比较大,应采用交互作用多因素方差分析处理此定量资料为宜。
2.3统计方法不合理,每一种统计方法都有其适用条件
例5:《高脂饮食对大鼠脂肪组织脂解调节因素的影响》[8],原文中采用单因素方差分析的LSD方法对(原)表3各组FFA浓度进行分析,得出结论具有统计学意义。
多个总体均数比较的方差分析,要求方差齐性。方差齐性实际上是指要比较的各组数据分布是否一致,通俗的说就是各组是否适合比较,一般的经验是如果在比较的各组中,如有一组的标准差是另一组的一倍时方差不齐性的概率较大。在做方差分析时,做方差齐性检验主要是确认数据的合理性(不具相关性)。对(原)表3数据进行方差齐性检验,可发现C组与OR组及OB组FFA浓度指标不能满足方差齐性的要求,故不能采用单因素方差分析的LSD方法。可以先进行对数、倒数或函数的转换,选择适当的转换形式,直到齐性检验变为不显著(不相关)。如果还不行就只能用非参数的单因素分析。
3定性资料统计分析方面存在的统计学错误
3.1误判资料类型,而误用定量资料统计分析方法
例6:题目:《传统体育对老年知识分子原发性高血压患者临床症状影响的观察研究》[9]原作者对原发性高血压,症状疗效评定标准是:头痛、眩晕、心悸、耳鸣、失眠、烦躁。各症状按症状轻重不同采用“半定量”计分法,按程度进行分级和计分,共分为4级:(“无”0分、“轻”1分、“中”2分、“重”3分),EH(原发性高血压)患者经6个月的传统体育锻炼实验,症状计分情况。治疗前后组内比较,除A组心悸、耳鸣、失眠症状外,3组均能改善老年知识分子EH(原发性高血压)患者临床症状(P
统计资料常常分为定量资料和定性资料两大类,所谓定量资料是指对每个观察单位用计量方法测量某项指标所获得的数值;如身高(cm)、血压(mmHg)、脉搏(次/min)、红细胞(104/mm-3)转氨酶(酶活性)等,都属于计量资料。而定性资料是指记录每个观察单位的某一方面的特征和性质[10]:如血型(A、B、O、AB)、职业(工人、农民、军人、学生)、性别(男、女),等等。本资料观察的是原发性高血压症状疗效,这里的0、1、2、3、4代表的是原发性高血压患者症状的轻重程度,属于定性资料中有序资料,(如:无、轻、中、重;治愈、显效、好转、无效、死亡),但原作者却错误地将其判断为定量资料,表的标题后括号内写 ±s的形式,表中给出也是平均数和标准差的数据。一般来说,t检验仅适于分析来自“单组设计、配对设计和成组设计”的定量资料,用分析定量资料的方法分析定性资料,显然是错误的。正确判定统计资料的类型是选用统计分析方法的首要前提[11]。本资料属定性资料,应根据分析目的,合理选用适合此类资料统计分析方法(如Riditi分析或者非参数检验秩和检验)。
3.2两样本率的检验误用两样本的t检验来代替
例7:《健身跑运动对中年人血脂异常者血脂、身体成分的影响》[12]一文中将所有受试者随机分成低强度组(L组)、中等强度组(M组)和对照组(C组)。数据统计数据用平均值±标准差形式表示。相关指标数据用t检验和多因素方差分析进行分析,P
运动医学研究离不开统计设计和统计学方法,如果选择错误导致结果有偏倚或结果原则性的错误,对运动医学的危害性较大。正确的统计分析是获得正确的科研结论的要素之一。只有明确资料的性质、试验设计类型、分析目的,掌握相关统计方法应用的前提条件,才能进行正确的统计分析。