统计学抽样方法

时间:2023-08-08 17:07:56

导语:在统计学抽样方法的撰写旅程中,学习并吸收他人佳作的精髓是一条宝贵的路径,好期刊汇集了九篇优秀范文,愿这些内容能够启发您的创作灵感,引领您探索更多的创作可能。

统计学抽样方法

第1篇

统计学》是财经院校经济类各专业的专业基础课,本课程的设置旨在培养学生对统计学的基本理论和基本方法的掌握,为相关专业课程的学习提供定性和定量的统计分析方法。

《统计学》是研究社会经济现象总体的数量表现和数量关系的方法论科学。

通过本课程的学习,使学生明确统计这个认识工具的特点、作用;掌握统计学的各种基本概念、基本原理和基本方法,尤其是各种定量分析的方法和技能,提高学生对社会经济现象数量研究时分析问题和解决问题的能力。

为更好地掌握《统计学》课程,除课堂教学应有的54课时外,要求学生做到课前预习、课后总结,重视本课程作业练习这一环节,以实现本课程的既定目标。

二、课程的教学目标及总的教学要求、重点、难点

教学目标及总的要求:

社会经济统计学是研究社会经济现象总体的数量表现和数量关系的方法论科学。

通过学习本课程,要求学生明确统计这个认识工具的特点、作用;掌握统计学的各种基本概念、基本原理和基本方法,尤其是各种定量分析的方法和技能,提高学生在对社会经济现象进行研究时的分析问题和解决问题的能力。

同时,为进一步学习各专业课程提供定性和定量分析的方法。

教学的重点:

统计学中的基本概念:统计总体、总体单位、标志、变量、统计指标和指标体系及其相互之间的区别和联系。

统计调查的意义,统计调查的分类。

统计调查方案的内容,调查对象、调查单位、填报单位和调查表、调查时间等概念。

统计报表制度的意义、作用和内容。

各种专门调查的概念、特点和作用。

统计整理的意义、步骤。

统计分组的概念、作用和形式。

分配数列的概念和种类。

分配数列中的名词概念,尤其是组中值的计算。

统计表的作用、结构和种类。

统计表的编制原则

总量指标的概念和作用。

总量指标的分类,尤其是时期指标与时点指标的区别。

相对指标的概念和作用及其表现形式。

各种相对指标的意义和计算方法。

正确运用相对指标的原则。

平均指标的概念和作用。

算术平均数、调和平均数、几何平均数、众数、中位数的意义和计算方法,注意算术平均数与强度相对指标的区别。

标志变异指标的意义和作用,各种标志变异指标的计算方法及特点,尤其是标准差的计算方法。

正确应用平均指标的原则。

动态数列的概念和作用。

动态数列的种类。

动态数列的编制原则。

各种动态水平分析指标和动态速度分析指标的意义和计算方法,这些指标相互之间的关系,如逐期增长量与累计增长量的关系、发展速度与增长速度的关系、环比发展速度与定基发展速度的关系、发展速度与平均发展速度的关系等。

序时平均数与一般平均数的异同点。

平均发展速度两种计算方法的侧重点。

动态数列的四种变动形态。

几种常用的测定长期趋势的方法:间隔扩大法、移动平均法,尤其是用最小平方法配合动态趋势方程。

季节变动的测定方法。

指数的概念、作用和种类。

综合指数的编制原理,数量指标指数、质量指标指数的计算。

平均数指数的编制原理,加权算术平均数指数、加权调和平均数指数的计算。

平均数指数与综合指数的关系,以及平均数指数在实际工作中的应用。

平均指标指数的编制和分析方法。

指数体系的概念和作用。

运用指数体系进行因素分析,以及根据指数体系进行指数间的推算。

抽样推断的概念、特点和作用。

抽样推断的基本概念。

抽样推断的理论依据。

抽样误差的概念和抽样平均误差的意义,抽样平均误差的计算方法

抽样极限误差的意义及计算。

概率度的意义及其与抽样推断可靠程度的关系。

区间估计的方法与步骤。

抽样方案设计的内容以及抽样方案设计的原则。

主要的抽样调查组织形式。

简单随机抽样条件下必要抽样单位数目的确定。

相关关系的概念和种类,现象之间相互联系的两种类型:函数关系、相关关系。

相关关系的特点。

相关关系的测定方法,相关系数的概念、计算方法和性质。

回归分析的概念和一元线性回归分析的特点、方法。

相关系数与回归系数之间的数量关系。

估计标准误差的意义及计算方法。

相关系数与估计标准误差之间的数量关系。

国民经济统计核算的概念及国民经济核算体系的内容。

国民经济核算中三大产值指标的核算方法以及国内生产总值的三种核算方法。

国民经济统计核算中的五大平衡表及四大账户体系。

教学难点:

统计学中的基本概念。

调查单位与填报单位的区别。

普查、抽样调查、重点调查、典型调查的区别。

总量指标和相对指标的分类,相对指标的计算方法。

各种平均指标的应用条件及计算方法。

标志变异指标的意义及计算方法。

各种动态分析指标的意义和计算方法,以及指标之间的关系。

数量指标指数与质量指标指数的区分和编制。

算术平均数指数与调和平均数指数的区分和编制。

因素分析法。

抽抽样误差、抽样平均误差、抽样极限误差、概率度的意义。

概率度与概率的关系。

区间估计。

必要抽样单位数目的确定。

相关关系的种类。

相关系数的计算方法。

一元线性回归方程的建立及其与直线趋势方程的区别。

估计标准误差的意义及计算方法。

第2篇

一、我国目前采用的样本规模确定公式

(一)控制测试中样本规模的确定内部控制制度符合性测试,即属性抽样,是依据统计学中假设检验的原理设计的。审计属性抽样,是指只有两种可能结果(信赖和不信赖)的随机试验,其概率分布为二项分布。由于二项分布计算公式比较复杂,而泊松分布近似于总体很大的二项分布。统计学家编制了“累积泊松分布数值表”,这样按照统计学确定样本容量的思想,利用泊松分布确定过度信赖风险系数来体现统计抽样规模计算式中标准差及系数;用可容忍偏差率上限,体现统计学中由极限误差(Δρ)形成区间的上限。建立审计属性抽样样本容量计算公式:

样本容量=信赖过度风险系数÷可容忍偏差率

使用上列计算公式来计算样本容量,在事先并不知道样本容量为多少的情况下,样本可能发生的偏差数很难预计。就是有了样本预计偏差发生数,还要通过查表确定过度依赖风险系数,再用公式计算样本容量,比较麻烦。为了提高审计效果和效率,人们根据泊松分布和不重复抽样原理,编制了供实务应用的统计抽样样本规模确定表。我国准则指南中详细介绍了样本规模的确定,注册会计师根据可接受的信赖过度风险选择相应的抽样规模表,然后读取预计总体偏差率找到适当的比率。接下来注册会计师确定与可容忍偏差率对应的列。可容忍偏差率所在列与预计总体偏差率所在行的交点就是所需的样本规模。由此可见,在控制测试中,注册会计师主要关注抽样风险中的信赖过度风险。

(二)细节测试中样本规模的确定

(1)传统变量抽样。设计传统变量抽样所需的数学计算,包括样本规模的计算,对于手工应用来说显得复杂且困难。注册会计师在使用传统变量抽样时通常运用计算机程序确定样本规模,一般不需懂得这些方法所用的数学公式。根据指南中样本规模确定公式,

样本容量=[预先估计的标准差×(可接受的误受风险的置信系数+可接受的误拒风险的置信系数)×总体规模÷(总体可容忍错报-预计总体错报)]^2

通过分析可知,以上样本规模确定公式是在充分考虑了误受风险和误拒风险的基础上得出的。

(2)PPS抽样。样本规模确定公式主要有两种方法:一是公式法,样本规模=总体账面价值*风险系数/[可容忍错报-(预计总体错报*扩张系数)]其中,风险系数代表注册会计师愿意接受的误受风险。注册会计师通过估计预计总体错报而间接的控制误拒风险,不需要特别控制误拒风险。二是查表法,由于PPS抽样以属性抽样原理为基础,注册会计师可直接使用控制测试中的统计抽样样本量表。此法与前面讨论的属性抽样原理相同,在此不再赘述。

二、我国准则中关于样本规模确定存在的问题

审计人员在进行审计测试时,可能发生两种抽样风险:一种是Ⅰ类风险,指抽样结果使审计人员否定了真实原假设的可能性,又称a风险,弃真风险;信赖不足风险和误拒风险分别指符合性测试和实质性测试中的a风险。另外一种是II类风险,指抽样结果使审计人员错误地接受了非真原假设的可能性,又称β风险,存伪风险;信赖过度风险和误受风险分别指符合性测试和实质性测试过程中的β风险。

通过上述分析可知,我国准则规定的样本规模确定公式,除了细节测试中传统变量抽样考虑了a风险,其余均为考虑此类风险。

a风险,是影响审计效率的抽样风险,β风险,是影响审计效果的风险。考虑到审计的目标,为了发表正确的审计意见,注册会计师一般只关注β风险。但a风险影响审计效率,可能会增加不必要的实质性程序,增加审计成本,尤其是在细节测试中,如果在某类交易或账户余额的账面金额可能不存在重大错报时根据样本结果得出存在重大错报的结论,注册会计师采用替代方法可能花费的成本大得多。

由于上述公式中存在没考虑的风险因素,据以确定的样本量必然小于实际应抽取的样本量,因此样本数据显示的结果不能代表总体特征,使得审计风险增大。

三、样本规模确定公式的改进

依据统计学原理,a风险和β风险属于变动方向相反的风险,没有一种假设检验可以使这两类风险同时达到最小。若要同时控制两类风险,一般地,在进行假设检验时,先是根据问题的要求,预先给出显著性水平以控制犯a风险错误的概率,而后用选择适当的样本容量的方法,在某种意义上减少犯β风险错误的概率。在统计学中,通常会应用施行特征函数的方法求解。在此只简单的说明样本容量计算的原理,对于具体的计算公式的由来,由于涉及大量概率论与数理统计等方面的知识,与审计学本身关系不大,故不赘述。

如前所述,在审计抽样中,为降低审计风险,必须同时考虑a风险和β风险。属性抽样下,审计人员同时控制a、β两类风险的条件见图1:

图中P。表示预计总体偏差率,P1表示可容忍最大偏差率。假设H0:P=P0,H1:P>P1,P为实际总体偏差率。

由图可见,审计人员只要适当地确定n(与分布的标准差有关)和V(临界值),就同时控制了a风险和β风险。

从H。分布看,有:

V=P0+Z1-αx0=P0+Z1-α

从H1分布看,有:

V=P1-Z1-x1=P0-Z1-

联立上述两式解出(即属性抽样样本规模确定公式):

n=

最后得出的样本规模确定公式为:

n=()2

其中:N为总体规模;Z1-IR/2为正态标准差(IR:α风险、误拒风险);Z1-IA为正态标准差(IA:?茁风险、误拒风险);TM为可容忍误差;EM为预期总体误差;SD为估计标准差

上面公式(3)即为改进的属性抽样样本规模的确定公式,同时考虑了两类抽样风险,保证审计效果的同时,提高了审计效率。

注册会计师确定样本规模受到多种因素的影响,且在控制测试和细节测试中有所不同。目前我国审计准则中规定的样本规模确定公式基本考虑了影响样本规模确定的重要因素,只是对于审计抽样风险的第一类风险有所忽略。本文只是浅薄的应用相关统计学原理进行了简单的分析说明,希望可以为审计抽样理论与实务的发展提供点建议。

参考文献:

第3篇

关键词:频率学派;贝叶斯学派;统计方法

统计学中几大影响比较大的学派是频率学派、贝叶斯学派和信念学派。在很长的时间内,频率学派或称经典学派的观点、理论占据了主流地位,其余两派并未得到足够的重视。但是在实际应用中,却早已应用贝叶斯学派的理念来处理问题。所以有必要在理解这几大学派思想的基础上,来了解不同思想的统计方法。

一、两大学派的特点和分歧

频率学派坚持对概率的看法是频率的稳定性,所以,凡是不能重复进行的试验的有关结果都不能应用概率作出判断。但是很多时候,人们都是根据已有的知识和逻辑推理能力来对统计问题作出判断。在实际经济环境中,情况总是比较复杂,很难具备可以进行重复试验的条件,这个时候频率学派的理论就很难运用上了。与之不同,贝叶斯学派认为,概率是反映事件发生可能性的一个度量,既可以是反映重复试验的频率稳定性,也可以反映人们的某一些类型的主观信念。只要可以接受到任何先验信息,就都能对特定问题进行逻辑推理。

频率学派和贝叶斯学派之间激烈的争论,促进了统计学的发展,使得统计学最为一门信息科学在学科体系上和思想上更完善。这两大学派争论的分歧:其一,对概率这个概念的认识。经典学派认为概率是纯客观的,是频率稳定性的内在依据。而贝叶斯学派则认为概率应包含客观概率与主观概率;其二,是对统计问题的看法。频率学派研究的重点是样本空间,认为样本是变化的,参数是固定不变的,并从中寻找规律来推断参数的性质。贝叶斯学派的重点是研究参数空间,认为样本就是已观测到的值,它已不再变动而参数则是随机变量。需要探讨的是,参数取值的变化规律;其三,利用信息的范围不同。贝叶斯学派既利用样本信息又利用先验信息,而经典学派只局限于从样本获取的信息。其四,推断的过程不同。贝叶斯学派是从参数的先验分布到后验分布。而频率学派却仅是根据样本的信息对参数作出推断。可以说,先验分布这是区分这两个学派的一个重要特征。

二、统计分析方法的基本思路

在参数估计的基本方法上,对于单一方程模型,最常用的有普通最小二乘法、广义矩估计和极大似然估计法等。对于联立方程模型有常用二段最小二乘法和三段最小二乘法等。基本的理论框架是对未知参数的模型建立,参数估计包括点估计、区间估计、假设检验和预测等内容。并以此来研究各种模型,如线性回归模型、非线性回归模型、联立方程组模型,面板数据模型、时间序列模型等。

而贝叶斯分析则采用不同的思路,来进行参数的估计,检验和模型的比较。一般有如下思路:在得到样本数据的基础上,建立模型,求出似然函数,同时先验信息得到先验分布,运用贝叶斯定理,推导出后验分布,分析得出的结论。

可以说,经典的统计分析方法与贝叶斯分析的方法,孰优孰劣,也不可以一概而论。经典的方法在发展体系上很严密,有严谨的数理基础,而贝叶斯方法则是提供了一种新的思维方式,是推进现代统计及相关学科理论发展的强大力量。

三、统计计算方法和软件的发展

随着现代电脑技术的发展,统计学也获得了飞快的发展,尤其是促进了统计的计算方法的发展,特别是在针对贝叶斯方法的计算得到了新的进展。这主要分为两类,一类是通过直接的抽样手段,得到后验均值的估计值,主要包括直接抽样、分层抽样、筛选抽样等;它们的缺陷在于只能用于比较简单、低维的后验分布。第二类为 MCMC(Markov chainMonte Carlo),近年发展迅速,在各个相关领域得到了广泛的应用。在实际研究工作中,经常遇到的是高维的复杂数据,这时运用传统的方法就遇到困难了。而MCMC方法为这一复杂的计算过程开辟了新的方向。它的基本思想是把一个复杂的抽样问题转化为一系列简单的抽样问题,而不是直接从复杂的总体中抽取样本,并利用电脑技术模拟这个过程。

由于庞大的计算量,复杂的高维数据,单靠人工计算是不可行的,针对各种统计计算方法的软件极大的促进了统计学各个分支的发展。在相关的经济领域,分别有MATLAB、S-Plus和R版本,在相关的生物统计领域还有WinBUGS,使用比较广泛,只是需要根据不同的模型自己来编写程序。

第4篇

社会学学科体系由社会学理论、社会学研究方法和分支社会学(应用社会学)三个部分组成。1999年7月召开的全国高校社会学学科教学指导委员会暨社会学系主任联席会议确定了大学本科社会学专业10门专业主干课,它们是:社会学概论、社会调查研究方法、国外社会学理论、中国社会思想史或中国社会学史、社会统计学、社会工作概论、社区概论、社会心理学、经济社会学、发展社会学(社会现代化)[4],建立了社会学专业的课程体系。在社会学专业课程体系中,社会学研究方法系列课程涵括了社会研究方法(笔者所在学校沿用了传统课程名称:社会调查研究方法)、社会统计学两门专业基础课。一些高校还围绕社会学研究方法开设了其他方法课程,如《统计软件应用》、《质性研究方法》、《学术论文写作》等,这些课程都可纳入社会学研究方法系列课程体系中。本文仅涉及社会研究方法、社会统计学和统计软件应用三门课程。社会研究方法介绍社会学研究的基本概念、基本原理和基本程序,从研究方法体系包括方法论、研究方式和具体研究方法及技巧;及社会学研究的完整过程包括选题、研究设计、收集资料、分析资料和撰写研究报告五个阶段等方面全面系统地介绍社会学研究方法的基础。社会统计学介绍定量数据资料的统计原理和方法,包括单变量与双变量的统计描述和统计推论方法。统计软件应用介绍运用统计软件处理定量数据资料的操作技术,包括统计描述和统计推论方法的具体操作技巧、统计图表的制作与编辑等技术。这三门课程分别从不同角度和侧重点介绍开展社会研究的方法和技巧,课程内容联系紧密且各有侧重。这三门课程是相互关联,内涵着逻辑关系,是一个课程体系。[5]社会学研究方法系列课程(下称系列课程)中的社会研究方法和社会统计学是社会学专业的核心课程,统计软件应用也是社会学专业的专业必修课,这三门课在社会学专业课程体系中占据十分重要的地位。社会学恢复的初期,中国社会学界在“打开窗户学习”的过程中,对西方社会学研究方法的关注和引进成为最主要的方面之一。[6]“在引进、借鉴美国社会学的初期,我们更多地表现出的是方法兴趣而非理论兴趣”[7]社会学及相关专业的学生要开展社会研究,必须完整地掌握这三门课程所包含的知识和技能,缺一不可。同时,系列课程也是社会学学科体系中应用特色最突出的部分,不仅要求学生掌握社会学研究方法的基本原理和逻辑过程,更要求学生通过调查实践掌握社会研究的综合技能和具体技巧,如设计合理的调查问卷、成功地实施调查收集资料、熟练并准确地操作统计软件对调查资料进行统计分析及撰写调查报告,要全面掌握这些方法必须通过社会学研究方法系列课程的系统学习和训练。

二、社会学研究方法系列课程教学改革的必要性

(一)现有教学模式存在不足

作为社会学专业的重要课程,各高校通常对系列课程的重要性给予了充分的肯定,从开课时间的安排到学分及学时的分配等多个环节都会进行充分考虑。但许多高校也由于师资力量、培养经费等因素的影响,对社会学研究方法系列课程的教学安排不尽合理,教学效果不十分尽如人意,在一定程度上影响了社会学本科学生研究方法综合能力和操作技能的提高,进而影响到社会学专业本科生的培养质量。当前存在的比较普遍的问题有:

1.系列课程的教学内容和教学方法还存在诸多不足,如教材选择、教学大纲编写、课程考核等诸多环节都是以每门课程为基本单位的,很少考虑系列课程之间的关系及不同课程对教学的特殊要求,缺乏从整体的角度对待系列课程之间的关系和协调,影响到学生从整体上把握社会学研究方法的系统知识。尽管每一门课的优化有利于研究方法系列课程整体水平的提高,但要真正提高社会学研究方法系列课程体系的综合教学质量,必须对现有教学方式进行改革,从课程整合的角度将三门课程融会贯通,形成体系。

2.系列课程部分内容存在重复交叉,不仅浪费了教学资源,也容易影响学生的求知欲和学习积极性。社会研究方法课程是系列课程的基础,从选题、研究设计、资料收集、资料分析到撰写研究报告,比较全面地介绍了社会研究的基本程序,作为一个独立的课程,社会研究方法教材中通常都包含了对定量资料分析方法的简单介绍,与社会统计学的教学内容存在重复和交叉。再如抽样方法是社会研究方法课程中十分重要的教学内容,而许多社会统计学的教材中也包含了抽样方法的内容。如果系列课程三门课程是由不同教师分别授课,而教师们备课及授课时不积极沟通和交流,就容易造成多门课程内容交叉、重复讲授,不利于系列课程教学效果的优化。

(二)系列课程的性质要求进行系列课程教学改革

系列课程包含的三门方法课程之间有非常紧密的联系,社会研究方法课程是另外两门课的基础,只有了解了社会研究的基本原理和研究过程之后,才能更深刻理解社会统计学在社会研究中的地位和应用目标。同时只有充分理解了社会统计学的基本方法和主要作用,在学习统计软件操作课程时才能真正掌握统计软件的灵活应用,进而认识到统计软件作为一个分析工具在社会研究中的应用价值和前景。多年的教学过程中,笔者屡次发现少数学生过分信赖统计软件的操作便捷和计算速度,而对社会统计学课程重要性认识不足,结果在统计软件课程学习时困难重重,不是不知如何选择操作方法就是对计算结果无法正确理解。因此,首先必须正确认识每门课程的性质及教学目标,深刻理解系列课程之间的关联,在此基础上着手改变现有的三门课程独立授课缺少联系的模式,促进各门课程之间的相互渗透与贯通,实现课程之间的整合优化。

三、社会学研究方法系列课程教学改革的实践探索

笔者所在的中南民族大学2001年开始开设社会工作专业、2002年开始开设社会学本科专业,2009年开始以社会学类专业合并招生,社会学研究方法系列课程是社会学类学生的专业必修课,学生进行专业分流前开设社会研究方法和社会统计学课程,进行专业分流后社会学专业和社会工作专业的学生分别开设统计软件应用课程。笔者自学校开设社会学研究方法系列课程以来,一直承担系列课程包含的三门课程的讲授任务。在多年的教学实践过程中,笔者逐步认识到系列课程教学安排及教学模式存在的不足,如早期教学安排中社会研究方法课程第二学期开课,社会统计学第四学期开课,而统计软件则安排在第六甚至第七学科开课,三门课程的开设时间间隔太长,学生对前一门课程内容遗忘快,教师不得不安排大量课时复习前一课程教学重点,即使如此教学效果仍受到影响。经过不断提出修改建议,学校教务部门几次修改教学大纲后,目前三门课程的开设时间比较紧凑,比较容易实现三门课程教学内容的顺利衔接和巩固。同时学生较早地全面掌握了社会研究方法后,在接下来的学习过程中更有能力参与或申请各级研究项目的研究工作,对其他课程的学习也有推动作用。由于本校社会学研究方法系列课程由同一教师先后承担教学任务,为顺利实现三门课程之间的整合优化提供了便利。经过不断摸索与努力,笔者开展了一系列推动研究方法系列课程整合优化的尝试,并取得初步成效。

(一)系列课程教学内容整合优化

所谓整合,是指按照一定的目标,合并全部资源并集中加以运用,以获得大于各个别资源所发挥效果之总和的整体效果。所谓优化,也称最优化、最佳化、最适化,指在资源约束的条件下,采用适当的方法和手段,对资源加以充分和有效的利用,以获得最理想的效果。[8]在教学实践中,针对三门课程教学内容存在部分交叉重复的现象,笔者在安排每门课的教学内容时进行了适当的取舍和调整,力争对三门课程的教学内容进行整合优化。如在第二学期开设的社会研究方法课程中,笔者只简要介绍定量分析方法与定性分析方法的不同特点及其在社会研究过程中的作用,定量分析的具体内容则不展开讲解。这样既为第三学期开设的社会统计学课程的学习做了必要铺垫,也使得这两门课的重点更为突出。再比如,由于在社会研究方法课程中着重讲解了抽样方法,在社会统计学课程中就不展开讲解抽样具体方法,只在简要回顾抽样方法的常用类型后着重从社会统计学角度介绍不同抽样方法带来的概率差异及样本容量的估算,这样安排较好地衔接了同一主题的内容又避免了教学内容的简单重复。其次,考虑到案例教学在社会学研究方法系列课程教学中的独特作用,系列课程教学过程中均采用了大量案例材料。为了更好地推动系列课程教学内容的整合优化,笔者在教学案例的选择和使用上做了不断改进和完善。如在社会研究方法课程中讲授问卷设计和抽样方法时,笔者采用了中国妇女社会地位调查等许多大型抽样调查的案例材料,向学生详细介绍中国妇女社会地位调查的抽样方案及调查问卷设计技巧。在社会统计学课程中讲解单变量统计描述等相关方法时,笔者再次引用中国妇女社会地位调查后期发表的调查报告数据,使学生将调查问卷的设计与后期资料分析方法紧密结合起来理解。在统计软件应用课程中,介绍变量编码时笔者则再次以中国妇女社会地位调查问卷为例介绍问卷中不同变量的编码方法,并从中选择合适的问题编制成更有针对性的问卷供学生练习使用。通过对相同或相似案例的不同讲解,不仅调动了学生的学习积极性(有些学生会顺着这个思路将在前期课程中出现的案例主动与后期开设的方法课程建立联系),也更好地体现了社会学研究方法系列课程之间内容的逻辑关系和知识体系的连贯性。在此基础上,笔者开始尝试通过不断积累和改进,建立三门课程可共享的系列课程共享案例资源库。希望系列课程共享案例资源库建成之后,系列课程教学中可根据各门课程的知识点和课程性质选择合适的案例穿插在教学中,教学内容也可根据各门课程的学时量和教学大纲的重点合理分布,从而有效避免某些交叉内容和案例的重复讲解,使各门课程的重点和特色更突出。

(二)系列课程教学方法改革

系列课程的教学内容有紧密联系,但课程重点和目标却各有特色。因此在系列课程教学改革实践过程中,除了对三门课程教学内容进行整合优化外,还要采取更适合不同课程性质和目标的教学方法。社会研究方法课程是系列课程的基础,涉及面广,内容较多,且既有强调理解和记忆的知识点,如社会研究方法体系、理论与研究的关系等;又有要求学生熟练掌握的具体技巧,如概念的操作化、调查问卷的设计等。因此这门课程要求教师采用形式多样的教学方法。对于偏重理解和记忆的知识点,笔者主要采用课堂讲授、案例分析等方法。对于概念操作化和调查问卷的设计等具体操作技巧等内容,笔者则努力调动学生参与教学及增强互动等方式提高教学效果,如分组讨论、课堂模拟调查、分组开展小型社会调查并进行调查体会交流等。社会统计学课程则侧重对基本统计原理的理解和各种统计方法的具体应用,在教学方法上,笔者通过课堂大量例题讲解和布置适当课后练习,再进行集中或个别答疑等方法使学生扎实掌握社会统计的基本方法。统计软件课程则从分别安排理论课和上机课的模式改进为理论和上机紧密结合的上机课模式,课堂上笔者结合知识点和统计软件的操作特点分时段讲解演示操作过程和方法,及时指导学生进行上机练习,环环相扣,步步跟进。结语在社会学回复重建三十多年来,社会学课程体系不断完善。社会研究方法在这一时期也进一步多样化、精细化,一些方法类的课程也有所增加,上海大学社会学系增设了质性研究方法、抽样方法、SPSS操作等课程。南开大学社会学系增设了数据分析技术、市场调查与预测等课程。北京大学社会学系增设了数据分析技术、统计指标与社会项目评估、人口统计学、市场调查与预测等课程。

第5篇

关键词:全期护理模式;围手术期;护理

    为了对采用全期护理模式对临床手术治疗患者进行护理的临床效果进行研究分析,使临床对手术患者在围手术期内的需要更加了解,为临床提供对手术患者在围手术期进行护理的最佳方式,使患者在围手术期内的心理状态和生命体征能够保持平稳,组织进行了此次研究。在研究的整个过程中,抽取90例接受手术治疗的临床确诊患者,将其分为两组,在围手术期内分别进行常规护理和全期护理干预。对两组患者在围手术期内的并发症情况、生命体征情况、心理状态情况、患者对护理服务的满意度进行比较分析。现将分析结果报告如下。 1 资料与方法

1.1  一般资料:2009年4月~2011年4月采用临床研究过程中常用的随机抽样方法,抽取来我院就诊的90例接受手术治疗的临床确诊患者病例,将其分为两组。A组患者男24例,女21例,年龄25~79岁,平均42.8岁;B组患者男23例,女22例,年龄22~81岁,平均41.4岁。抽样患者自然资料比较,差异无统计学意义(P>0.05),具有可比性。所有患者在接受治疗前,均经过相关的临床检查后确诊,并由患者本人或家属在同意书上签字。

1.2  方法:将抽样中的90例临床确诊患者,采用随机分组方法分为A、B两组,平均每组45例。A组患者在围手术期内进行常规护理;B组患者在围手术期内采用全期护理干预。对两组患者在围手术期内的并发症情况、生命体征情况、心理状态情况、患者对护理服务的满意度进行比较分析。

1.3  统计学处理:在本次研究过程中所得到的所有相关数据,均采用SPSS 14.0统计学数据处理软件进行处理分析,以P<0.05为差异有统计学意义。

2 结果

    经过仔细研究后我们发现,B组患者在围手术期内出现并发症和不良反应的例数明显少于A组患者,且差异有统计学意义(P<0.05);该组患者在围手术期内生命体征表现明显优于A组患者,且差异有统计学意义(P<0.05);该组患者在围手术期内的心理状态评分明显低于A组患者,且差异有统计学意义(P<0.05);该组患者对临床护理服务的满意度明显高于A组患者,且差异有统计学意义(P<0.05)。详见表1~3。

表1  两组患者护理前后心理状态情况比较(,分)

组别

SAS

SDS

护理前

护理后

护理前

护理后

A组

61.7±2.3

57.2±2.4

63.1±2.6

59.2±2.2

B组

62.4±3.4

42.4±3.7

62.2±4.1

44.3±3.8

P值

>0.05

<0.05

>0.05

第6篇

一、 分类讨论思想

【解析】这个活动是让同学们通过普查的方式去经历收集、整理、描述和分析数据得出结论的统计过程,在经历这个统计调查的过程中,感受统计的思想,建立统计的观念,体验统计的作用,逐步建立用数据说话的习惯. 能完成这项活动,同学们必须将各种情况分类讨论,才能设计出表格,这里体现了分类思想.

二、 特殊到一般的思想方法

例2 下列调查方式,你认为最合适的是( ).

A. 日光灯管厂要检测一批灯管的使用寿命,采用普查方式

B. 了解衢州市每天的流动人口数,采用抽样调查方式

C. 了解衢州市居民日平均用水量,采用普查方式

D. 旅客上飞机前的安检,采用抽样调查方式

【解析】检测灯管的使用寿命和了解居民日平均用水量,若采用普查方式耗时耗力;旅客上飞机前的安检,采用抽样调查方式不能保证万无一失.

例3 某校为了了解全校2 000名学生的课外阅读情况,在全校范围内随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,将结果绘制成频数分布直方图(如图所示).

(1) 这50名学生在这一天课外阅读所用时间的众数是多少?

(2) 这50名学生在这一天平均每人的课外阅读所用时间是多少?

(3) 请你根据以上调查,估计全校学生中在这一天课外阅读所用时间在1.0小时以上(含1.0小时)的有多少人?

【解析】普查通过调查总体中每个个体的情况收集数据,调查的结果准确,但往往花费多,工作量大,而且有些调查也不宜使用普查. 抽样调查通过调查样本来收集数据,比较经济,工作量较小,便于进行,但样本的抽取是否得当,直接关系到对总体的估计. 为了获得较为准确的调查结果,抽样时要注意所选样本的代表性.

三、 数形结合思想

(3) 在扇形统计图中,计算出“骑车”部分所对应的圆心角的度数.

(4) 如果全年级共500名同学,请你估算全年级步行上学的学生人数.

(1) 该校对多少名学生进行了抽样调查?

(2) 请分别在图1和图2中将“抖空竹”部分的图形补充完整.

(3) 已知该校九年级学生比八年级学生多20人,请你补全上表,并利用样本数据估计全校学生中最喜欢踢毽子运动的人数约为多少.

第7篇

关键词:统计学;教学模式;EXCEL

进入21世纪,随着我国市场化步伐的加快,社会对新知识的需求日益增加,无论是国民经济管理,还是公司企业乃至个人的经营、投资决策,都越来越依赖于数量分析,依赖于统计方法,统计方法已成为管理、经贸、金融等许多学科领域科学研究的重要方法。教育部也将《统计学》课程列为财经类专业本、专科专业的核心必修课程之一。力图通过《统计学》的学习,使学生掌握探索各学科内在的数量规律性,并用这种规律性的解释来研究各学科内在的规律。同时,由于统计学所倡导的尊重客观实事,通过调查研究用实事说话,这也有利于培养学生的实事求是的学习、工作和科学研究精神。

一、《统计学》课程教学面临的挑战

1、内容日益丰富。长期以来,在我国存在两门相互独立的统计学——数理统计学和社会经济统计学,分别隶属于数学学科和经济学学科。20世纪80年代以来,建立包括数理统计学和社会经济统计学在内的大统计学,逐步成为我国统计学界的共识。1992年11月,国家技术监督局正式批准统计学上升为一级学科。国家颁布的学科分类标准已将统计学单列为一级学科。随着大统计学思想的建立和统计学在实质学科中的应用的需要,大多数学校和老师在财经类专业的本、专科专业《统计学》教学过程中,除了保留社会经济统计学原理中仍有现实意义的内容,如统计学的研究对象方法、统计的基本概念、统计数据的搜集整理、平均及变异指标、总量指标、相对指标、抽样调查、时间序列、统计指数等;同时也系统的充实了统计推断的内容,如:统计数据的分布特征、假设检验、方差分析、相关与回归分析、统计决策等。这一变化使得《统计学》的内容更适合相关实质学科的发展需要。

2、学生的学习难度加大。首先、结合《统计学》的课程特点——概念多而且概念之间的关系十分复杂、公式多且计算有一定难度等。如果学生不做必要的课外阅读、练习和实践活动,是很难理解和掌握的。对于财经类专业的本、专科专业的学生来说,本身的专业课学习负担已不轻。其次、对于财经类专业的本、专科专业的学生来说,由于其本专业的课程体系要求,使得学生的数学或者数理统计的基础不是特别好,对于专科学生来说更不用说,推断统计将是他们学习的困难。再说,《统计学》作为专业基础课,一般安排在一年级或二年级第一学期,在这个学习时段也是大多数专科生和本科生忙于计算机课程和英语课程的考证时段。如果以牺牲授课内容和降低要求来减轻学生的学习负担,显然有悖于《统计学》课程的教学和相关专业的发展要求。所有这一切对于学生学好这一课程面临的困难可想而知。

3、教师的教学难度加大。授课内容越来越丰富;课程难度太大可能导致学生兴趣下降;在倡导学生自主性学习的背景下,授课时数大为减少(一般安排一个学期共17~19教学周,每周2~3课时);高等教育扩招后,由于师资力量一时没有跟上,大多数学校,授课班级学生人数越来越多,一个教师跨越不同专业授课不再新鲜。这要求授课教师必须深刻领会授课内容的核心和相互关系,学会控制和驾驭课堂教学,学会激发学生的兴趣,注重统计学在不同专业领域的具体应用等等。作为这门学科的授课教师特别需要认真考虑该怎么办?

二、《统计学》教学的发展趋势分析

1、统计学从数学技巧转向数据分析的训练。在计算机及计算机网络非常普及的今天,统计计算技术不再是统计学教学的重点了。统计思想、统计应用才应该是重点。现代统计方法的实际应用离不开现代信息处理技术。统计软件的使用,不仅使统计数据的计算和显示变得简单、准确,而且使统计教学由繁琐抽象变得简单轻松、由枯燥乏味变得趣味盎然。所以,在统计教学过程中,大量的内容只需要给学生讲清楚统计基本思想、计算的原理和正确应用的条件、正确解读计算的结果,而对大量复杂具体的计算可以交给计算机去完成。

比如方差分析,手工计算量非常大,没有计算机软件的支撑,是很难教学实际问题分析的。现在我们只要讲清楚方差分析要做什么,为什么方差分析要解决的中心问题是判断有无条件误差,而原假设又是K种不同水平下总体的理论均值是否相等,检验结果表示什么等就可以了,大计算量的工作让计算机去完成。

2、通过统计实践学习统计。也就是以学生为中心,通过课堂现场教学、引导学生先读后写再议、模拟实验、利用课余时间完成项目、利用假期时间,通过参加学校组织的某些团队、小组或自己组织去开展一些与专业有关的活动,如社会调查、专题研究、提供咨询、参与企业管理等方法。全方位地激发学生的学习兴趣、培养学生的专业能力、方法能力和社会能力。

比如依同学们在设计调查问卷和调查方案的基础上,让他们组成若干调查小组(如以寝室为单位),在校园内真正进行一次统计调查活动,从具体调查对象和单位的确定,样本的抽取(不一定要很大),问卷的发放、回收与审核,数据输入与资料整理,估计与分析,一直到调查报告的编写,调查总结或体会的形成,全部由同学自己来完成。这样,同学们就亲身参与了统计调查、统计整理和统计分析(含统计推断)的整个过程,效果很好。

三、基于EXCEL的《统计学》教学设想

如何从烦琐的数理统计技巧转向数据处理的训练,同时还要使学生容易掌握并有机会辅之于实践。教师的导向是第一位的,要求必须选择容易获得而且普及性比较强的统计分析软件,并在课堂教学和引导学生实践中广泛采用。

(一)微软公司开发的EXCEL软件无疑是我们最好的选择

专业的统计分析软件SPSS、SAS、BMDP、SYSTAT其功能固然强大,统计分析的专业性、权威性不可否认,但是对于没有开设统计学专业的院校这些软件并不常用,如果学生要进行自主性学习也比较难以找到相应的工具,此外专业统计分析软件的英文操作界面,也让中国人用起来不是很顺手。微软公司开发的EXCEL软件作为一款优秀的表格软件,其提供的统计分析功能虽然比不上专业统计软件,但它比专业统计软件易学易用,便于掌握。在Windows操作系统极为流行的今天,EXCEL也是随处可见。对于《统计学》这门课程而言,利用EXCEL提供的统计函数和分析工具,结合电子表格技术,已能满足统计方面的要求。

(二)基于EXCEL的《统计学》教学设想

1、在教学内容上,依据EXCEL的函数功能、电子表格功能、数据分析功能,结合统计学原理的基本理论和方法,整合教学内容。比如传统的统计学原理教学过程中,对统计数据的搜集主要强调统计报表制度,在EXCEL环境应该更注重抽样推断,EXCEL提供的随机抽样工具使得抽样调查不再是十分复杂的技术,统计图也可以被广泛运用于对数据的描述;再比如现有统计学教材很多都讲根据整理的数据计算平均数时,都用加权平均的方法,当用组距式变量数列计算平均数时,用组中值作为各组的代表值进行计算。我们知道,组中值作为各组的代表值是假定各组变量值在组内是均匀分布的,如果实际数据与这一假定相吻合,计算结果比较准确,否则误差比较大。事实上实际数据往往就不是均匀分布的,因此用组中值计算的平均数都是近似的,而且相同资料编制的不同变量数列计算的平均数还不相等。其实为了编制变量数列,我们必须输入原始数据,EXCEL的有关程序可以得到准确平均数,哪里还有必要按加权算术平均的方法计算近似的平均数呢?那么有没有必要编制变量数列、特别是组距式变量数列呢?有没有必要按加权的方法计算平均数呢?我们认为有必要,但是组距式变量数列的主要功能不再是提供计算资料了,而是用于表现资料的分布状况和进行分析用;加权平均方法主要是介绍和要求学生掌握加权平均的思想,用于综合评价分析中。

2、案例教学成为《统计学》课程的重要内容。案例教学法不仅可以将理论与实际紧密联系起来,使学生在课堂上就能接触到大量的实际问题,而且对提高学生综合分析和解决实际问题的能力大有帮助。结合学生所学专业精选案例教学,比如对于金融专业的学生可以设计用几何平均数计算投资的平均收益率、运用标志变异指标考察投资组合的风险大小等。对于经管专业的学生,精选抽样推断、假设检验、方差分析对于控制产品质量,经营决策等方面的案例,深入浅出地介绍这些方法的基本思想、并用EXCEL进行分析。既激发了学生的兴趣、扩大了学生的视野,也使统计学的课堂不再是教师一块黑板、一支粉笔、一本教材、一张嘴巴就能将一门专业课程从头讲到尾。

3、改革考试方式和内容,合理评定学生成绩。考试是教学过程中的一个重要环节,是检验学生学习情况,评估教学质量的手段。对于《统计学原理》的考试,多年以来一直沿用闭卷笔试的方式。这种考试方式对于保证教学质量,维持正常的教学秩序起到了一定的作用,但也存在着缺陷,离考试内容和方式应更加适应素质教育,特别是应有利于学生的创造能力的培养之目的相差较远。在过去的《统计学》教学中,基本运算能力被认为是首要的培养目标,教科书中的各种例题主要是向学生展示如何运用公式进行计算,各类辅导书中充斥着五花八门的计算技巧。从而导致了学生在学习《统计学》课程的过程中,为应付考试搞题海战术,把精力过多的花在了概念、公式的死记硬背上。这与财经类专业培养新世纪高素质的经济管理人才是格格不入的。为此,需要对《统计学》考试进行了改革,主要包括两个方面:一是考试内容与要求不仅体现出《统计学》的基本知识和基本运算以及推理能力,还注重了学生各种能力的考查,尤其是创新能力。二是考试模式不具一格,除了普遍采用的闭卷考试外,还在教学中用讨论、答辩和小论文的方式进行考核,采取灵活多样的考试组织形式。学生成绩的测评根据学生参与教学活动的程度、学习过程中提交的读书报告、上机操作和卷面考试成绩等综合评定。这样,可以引导学生在学好基础知识的基础上,注重技能训练与能力培养。

参考文献:

[1]谢安邦.高等教育学[M].北京:高等教育出版社,1999.

[2]贾俊平.统计学[M].北京:中国人民大学出版社,2000.

第8篇

在医学论文写作中,医学统计学方法应用是必不可少的,正确使用能保证科研工作顺利进行,并使科研成果更具有科学性、代表性和可靠性。反之,如果使用不当或者误用,会直接影响研究结果的质量,反而会使读者产生误解,甚至有时会导致错误的结论。近年来,医学统计学方法在医学科研中的应用越来越受到国内广大医学科研工作者的重视,统计分析结果表达已成为医学论文中一个不可缺少的重要组成部分。医学统计学是评价医学科技论文质量优劣的重要依据,然而从近年发表的论文来看,有不少作者对统计方法的使用还不熟悉,实际应用中统计方法滥用、错用和误用的情况时有发生[1]。据国外20世纪60年代到80年代对不同医学期刊的调查,有统计学错误的论文比例最高者达66%,最低者也有20%[2-4]。国内有学者对5种中华医学会系列杂志论著中统计学方法的应用状况进行了调查,结果显示,1985年统计错误的论文比例为24%,1995年为36%[5]。这些调查研究均说明统计方法误用的严重性以及正确应用的紧迫性。国外从20世纪70年代起就有针对医学论文的科研设计与统计方法应用情况的调查研究,国内学者也进行了相关研究[6]。这种研究有助于及时了解医学科研论文中统计方法的应用质量,发现存在的问题,提高医学科研工作者应用统计方法的水平。笔者总结了近年来已发表的医学科技论文中常见的统计学问题,希望能引起各位专家学者和临床医生的共识与重视,促进我国医学期刊质量的提高。

1 统计设计存在的常见问题

统计设计是整个研究中最重要的一环,是研究工作应遵循的依据。常见的统计设计问题有:忽视组间均衡性,样本缺乏代表性,样本例数不足,未设置对照组,未随机分组,未提出统计分析方法等。针对以上问题,在科研设计中一定要遵循实验设计的四大原则即“随机、对照、均衡、重复”的原则[6]。

1.1不遵循或不重视随机化原则

随机化是科研设计的重要原则,直接影响研究结果的可信度。随机化既要随机抽样,还要随机分组,并有足够的样本量作前提。然而,在医学论文中许多作者对此不够重视,主要表现在论文中统计处理随机化不突出,随机化缺失情况比较常见,有的论文甚至将随机误解为随意、随便,不采用随机化处理方法,导致结果缺乏可靠性。还有些文章中没有提出“随机”抽样的设计与方法,没有排除标准,给人随意选择病例之感,且病例数少,因此没有代表性,所得出的结论不可靠。部分文章虽然注明了“随机”,但未提及采取什么方法进行随机化研究或两组间的例数相差甚远,不符合随机化的一般规律,没有临床参考价值[7]。

1.2缺少对照研究或对照组设计不合理

正确设立对照是临床或实验研究的一个核心问题,设立对照的意义在于说明临床试验或实验研究中干预措施的效应,减少或防止偏倚和机遇产生的误差对试验结果的影响。目前,国内许多期刊发表的论文对照组设计不合理现象比较普遍,尤其有些作者对某种新药或新技术在临床的应用观察研究中,不设对照组,缺乏对照观察,得出的结论缺乏科学性,令人怀疑。有的文章虽然设立了对照组,但在分析结果时,却没有将试验组与对照组的结果进行比较,而仅将各组间的自身前后进行比较,从而使该研究失去对照意义。对照组选择不当,还表现在两组间重要的临床特征和基线情况相差太大,无可比性,如性别、年龄、病情、经济情况和文化程度等不一致,如有些论文将健康人或志愿者作为对照组,使结果受到非处理因素的影响,产生偏倚或系统误差,使结论不可信[7]。

1.3均衡性原则掌握不够

均衡性原则要求实验中的各组之间除处理因素不同外,其他可控制的非处理因素要尽可能保持一致。特别对疾病预后有重要影响的临床特性一定要在组间分布均衡。各组间越均衡,可比性越强。有些作者在对病例进行分组时,忽视了均衡性原则,两组之间没有可比性,结论自然是错误的。具体表现在:有的文章对治疗组与对照组的相应统一指标没有设在均衡的水平上。对治疗组情况交代的比较详细,而对对照组的年龄、性别、病情等不予交代,或所选对照组的年龄与治疗组不在一个年龄段,影响了作者对指标的观察[7]。

1.4重复的原则掌握不好

所谓重复,一是指重复试验或平行试验,二是指各样本组的例数要有一定的数量,即样本的例数要足够大。虽然随机化是增强非处理因素均衡性的重要方法,但当各组内例数过少时,尽管采用了随机化分组的方法,也难以保证非处理因素的均衡一致。在随机化分组的基础上,只有样本例数足够大,才能使非处理因素均衡一致,同时也才能使抽样误差减小,增强样本对总体的代表性。一般来说,在随机分组的前提下,样本例数越大,各组之间非处理因素的均衡性越好;但当样本量太大时,往往又会给整个实验和质量控制工作带来更多的困难,同时也会造成浪费。为此,在实验设计时,还应保证在实验结果具有一定可靠性的前提下,确定最少的样本例数。一般说来,计数指标每组样本不得少于20~30例,计量指标每组样本不得少于5~10例。在多因素分析时,一般认为样本例数至少为观察指标的5~10倍[8]。

1.5样本的含量

样本的含量的大小直接影响到结论的可靠性。样本量过少,则抽样误差大,结果可靠性差,且经不起重复验证;反之,盲目加大样本量也会造成人、财、物的浪费,同时也造成非抽样误差增大。故应在保证研究结果精确可靠的前提下,确定最小的样本量。如某篇论文报道某药治疗的临床疗效,实际总例数为10例,其中6例有效,于是作者得出有效率为60%。显然,有限的病例数不能充分说明该药是否有效,作者贸然得出结论,容易给他人造成假象甚至误导[9]。

2 统计方法选择与使用不当

在选择统计方法之前,首先应确定研究资料是计数资料还是计量资料。只划分其类别而得到的资料为计数资料,也叫定性资料,如根据治疗结果计算出的治愈率、阴性率、阳性率等。测定某个具体数值而得到的资料为计量资料,如血压值、血细胞计数、血氧分压测定等许多物理诊断和化验检查的结果。目前,医学论文中计数资料最常用的统计方法为χ2检验,计量资料最常用的统计方法为t检验。值得注意的是,各种假设检验方法均有其适用条件,应根据资料特点来选用最适当的方法。均数与标准差分别是描述正态分布资料集中和离散趋势的指标。能否选用“均数±标准差”来描述某一资料的分布特征,关键看该资料是否符合正态分布。当资料不符合正态分布或方差不齐时,应将资料转换使之符合正态分布,方差齐性后再用t检验或方差分析,否则用秩和检验。有些作者在使用t检验时,未考虑到上述适用条件而盲目使用,造成统计学处理不当或统计学计算错误[10]。#p#分页标题#e#

2.1统计指标应用不当

2.1.1描述计量资料的统计指标描述计量资料的统计指标主要有平均数指标(算术均数、中位数M等)和变异指标(标准差s和四分位数间距Q等),在应用时一定要注意它们各自的适用范围。对于非对称分布资料,算术均数不能反映数据的平均水平,应采用中位数描述。一般地,正态资料或对称资料用描述,偏态资料用M和Q来描述。在不能确定数据的分布类型时,应选用M和Q进行统计描述。四分位数间距Q是75%分位数P75和25%分位数P25之差,即Q=P75-P25,所谓百分位数Px是将全部观察值分为两部分,理论上x%的观察值比它小,(100-x)%的观察值比它大,中位数M是50%分位数P50。、s、M、Px与Q可通过统计软件直接输出[9]。

2.1.2描述计数资料的统计指标描述计数资料的统计指标有绝对数和相对数。绝对数是原始资料经汇总得到的小计或总计数。相对数是两个有关的绝对数之比,主要包括率和构成比(百分比)。医学论文中相对数应用的主要问题之一是分母较小。分母较小时,相对数的可靠性不能保证,在这种情况下,宜直接用绝对数进行描述而不宜计算相对数。医学论文中相对数应用的主要问题之二是将构成比误用来说明事物发生的强度。构成比只能反映事物的内部构成,不能说明事物的发生强度。医学的研究对象主要是人以及与人体有关的各种因素。由于生物现象的变异较大,各种影响因素又错综复杂,研究常是抽样观察,使事物本质差异与抽样误差混杂,故需用统计方法透过偶然现象来探测其规律性。如果不能正确运用统计学方法,造成统计学上的偏差或失误,就很容易把本来成功的结果当成失败而放弃,或把失败的教训误认为成功的结论而加以宣传。在进行科研设计时要严格遵循科学的统计学分析方法,不能留下隐患,否则,再高明的统计学专家和统计学软件也无法弥补科研设计缺陷造成的损失。总之,统计学分析在医学研究和论文写作中意义重大。作者在撰写论文时,应注意识别、总结有代表性的、有借鉴意义的统计学领域的缺陷、失误或错误的多发点,特别留心易出现统计错误的险区,从而使论文中的统计学问题减到最低限度。认真检查、仔细核验,尽量避免上述错误,必要时还可以请统计学专家帮助把关[12]。

2.2统计方法描述或选择不当

统计方法选择非常重要,它直接影响结论的可靠性[12]。临床资料的结果变量可分为计数资料、计量资料和等级资料。计数资料指将观察对象按两种属性分类,如生存、死亡,治愈、未治愈,有效、无效等,通常转化为率。如果是两组间的比较,则采用四格表χ2检验或其校正公式,如果是多组间率的比较,则采用行×列表资料χ2检验。计量资料指对某一个研究对象用定量的方法测定某项指标得到的资料,一般均有计量单位。通常资料呈正态分布时,两组间均数比较用t检验,多组间均数比较用方差分析和q检验。当资料不呈正态分布或方差不齐时,也可用秩和检验等非参数检验法。

2.2.1统计方法描述不清

医学论文中常可发现作者未交代所用的统计方法,如是配对设计的t检验还是成组设计的t检验,是Ridit分析还是χ2检验,是作相关分析还是作回归推断。统计方法交代不清或根本不予交代,使读者对论文结论的正确与否无法判断。有的作者只提一句“经统计学处理”后,就写出结论。有的甚至直接用P值说明问题,笼统地以P<0.05或0.01、P>0.05便称结果差异有无显著性,P值的大小不说明差值的大小,它还与抽样误差大小有关[13]。因此,还应写明具体的统计方法,如有特殊情况,还应说明是否采用了校正,应写出描述性统计量的可信区间,注明精确的统计量值和P值,然后根据P值大小作出统计学推断,并作出相应的医学专业结论。

2.2.2假设检验方法交代不清不交

代假设检验方法或假设检验方法交代的不具体、不清楚是医学科研论文中常见的错误。如果不交代假设检验方法或假设检验方法交代的不具体,读者就无法考察论文的统计学方法选择的是否正确,无法核对计算结果是否准确。每一种假设检验方法都有其特定的适应条件和严格的适用范围。对于同一组资料,采用不同的假设检验方法可能得出截然相反的结论。如将配对设计的资料按成组设计资料的方法处理,将会损失样本提供的信息、降低检验效率,可能使原本有统计学意义的结果无统计学意义[14]。在论文写作时,不但要交代选用的是什么统计学方法,而且统计学方法要尽可能具体。如选择t检验,要说明是配对t检验,还是成组t检验;选择方差分析时,要说明是完全随机设计的方差分析,还是配伍组设计的方差分析。对于四格表资料,应说明是一般四格表χ2检验、配对四格表χ2检验及四格表资料的精确概率法等。

2.2.3统计方法选择常见错误

①误用χ2检验。χ2检验有一定的适用条件,n>40且理论数(T)>5时,可用一般χ2检验;n>40,但至少有1个T>1且T<5时,可用校正χ2检验;n<40或T<1时用χ2检验的确切概率法[15]。②t检验误用于多组资料的比较。在医学期刊中常会出现将t检验误用于多组资料的比较。多组资料的比较应该采用方差分析(F检验),当差异具有统计学意义时,再进一步作两两比较。当各组均与一个对照组比较时采用Dunnettt检验;当各组相互循环比较时,则常采用Student-Newman-keuls(SNK)检验,又称q检验[16]。③配对t检验与成组t检验误用。大部分论文只注明采用t检验,而未注明是配对t检验还是成组t检验。配对t检验常用于处理前后的自身对照,即差值均数与总体均数“0”的比较;成组t检验适用于成正态分布的两个小样本均数间的比较。④资料不呈正态分布时未用非参数检验。t检验F检验等适用于呈正态分布、方差齐且有确切的测量数值的资料,而非参数检验(如符号检验、秩和检验Wilcoxon法、秩检验-KruskalWallis法、Friedman法、Ridit分析、Seperman相关等)对资料无特殊要求,对按大小顺序、评分、等级、反应程度甚至色调深浅等资料都可进行分析比较[17-18]。因此,对于多组计量资料的比较,呈正态分布且方差齐时用F检验,方差不齐时可用变量变换,或采用秩和检验;对于两个小样本均数的比较或处理前后的比较,方差齐时用成组t检验或配对t检验,方差不齐时用t′检验[19]。

3结果解释时存在的问题

统计分析的结果是无效假设或是不能无效假设。无效假设在一般的统计检验为两组总体参数相等。无效假设只能说两组总体参数不相等而并不能说两组相差很大。两组相差如何要对可信区间进行研究观察后得出。由于统计检验不能得出差别的大小,因而结论不能说“有明显差异”或“有显著差异”,也不能说“差异非常显著”,更不能说“差异明显”。在国外的统计书籍上的英语表达为“significant”,它的正确意义应当是“有意义的、有重要性的”。俄语为“Значмый”和日语中的“有意”也是这个意思。国内只有极个别的英汉词典把“significant”误译为“显著的”。正确的说法应当是“差异有统计学意义”或“差异有高度统计学意义”等[20]。在解释差别有统计学意义的结果时,有些人常常根据P值的大小作出对实验效应差别程度不同的专业结论[21]。例如某实验研究,比较甲、乙两种治疗方法对某病的治疗效果(假定甲法的疗效优于乙法),若得到“P<0.001”,则认为甲法极显著优于乙法;若得到“P<0.01”,则认为甲法非常显著优于乙法;若得到“P<0.05”,则认为甲法显著优于乙法。犯这种错误的原因是错误的理解了统计学中P值的概念[7]。统计学上根据假设检验原理推算出来的P值表示拒绝特定的无效假设可能犯假阳性错误的概率。P值的大小并非指差异的太小,只能反映两者相同或不相同。P值越小,说明越有理由认为两种处理方法效果不同,而不能反映对比的两组或多组之间差异的大小。差异的大小只能根据专业知识来确定。此外,甚至在部分投稿文章中未交代所采用的统计分析方法,也未见应用统计学的迹象,仅从各组数据的均数大小做出了统计推断。医学期刊论文中暴露出来的统计学错误,从表面上看是编辑部和审稿者把关不严所致。事实上,即使审稿时发现了上述错误,也无法改正。因为实验设计的错误只有在科研工作开始之前才有可能得到纠正。即使编辑工作者能够阻止有严重统计学问题的,也仅仅是治标而已。如何使广大医学论文作者在医学研究中正确应用统计学,提高科研质量才是治本[7]。#p#分页标题#e#

4对策与建议

众所周知,统计学是从事科学研究不可缺少的工具。从试验设计、资料收集与表达、数据处理和结果分析,每一个环节都需要正确地运用统计知识,才能真正发挥统计学在科学研究中应起的作用。然而,在已出版和发表的一些学术专著和论文中、通过评审的科研成果和答辩的学位论文中,经常可以看到忽视、轻视和误用统计学的现象[22]。

知识应完善编辑人员的知识结构,保证统计学应用的准确性。为此,可定期聘请统计学专家对审稿人员进行统计学知识培训。科技期刊的群体效应理论[23]认为,期刊编辑的专业结构应多元化,以利于编辑互相学习,实现知识互补。医学期刊编辑部可考虑聘用统计学专业的研究生作为编辑。编辑应将医学统计学作为自己的必修课,通过多种方式,如自学自修,参加讲座或培训班学习统计学知识,有条件的编辑部,如医学院校学报编辑部,可以有计划地组织编辑参加本科生或研究生医学统计学课程的学习,也可鼓励编辑人员在职攻读统计学专业研究生学位。这样,可以提高全体编辑人员的统计学水平,最终使编辑和审稿人都能够发现论文中存在的统计学错误,并指导作者修改,正确进行医学论文中有关统计学分析的描述[24]。另外,有关职能部门或学会可组织与医学统计学相关的培训班,聘请统计学专家讲课,对编辑人员进行定期统计学知识培训,加强科研设计、统计学知识的学习[19]。

4.2加强医学统计学专家审稿

医学研究论文专业性强,经常涉及统计学处理问题,有时会遇到统计方法复杂的稿件,这不仅需要本学科专家审稿,而且需要医学统计专家把关,只有这样,才能保证论文所报道的研究成果的真实性和可靠性。医学期刊编委会中应有统计学专家,专门负责稿件统计学方面的审查工作。

4.3强化作者的统计学意识

第9篇

[关键词] 大数据时代;数据质量;信息孤岛

doi : 10 . 3969 / j . issn . 1673 - 0194 . 2016. 23. 093

[中图分类号] TP311 [文献标识码] A [文章编号] 1673 - 0194(2016)23- 0178- 02

1 大数据与大数据时代

近年来,随着英国维克托・迈尔-舍恩伯格的《大数据时代》和美国Bill Franks的《驾驭大数据》等著作的出版,大数据引起了社会的广泛关注,人们已经意识到大数据时代正在呼啸而至。大数据几乎对每个领域都会产生影响,所以限于不同领域各自的特点,对大数据的表述也不同,但是一个广泛的观点是:“大数据是一个数据集合,这个数据集合是无法在规定时间里用常规软件工具对它进行搜集、整理和分析的。”

2 大数据时代对统计数据的挑战

大数据时代需要既讲机遇也讲挑战。各个应用领域的不断变化使得统计学成为一门难以成熟的学科。所以在数据分析的世界里,统计学发展的终身动力是不断提高驾驭数据的能力。大数据是推断数据,不是原始数据,所以会存在抽样偏倚、随机的和非随机的误差。数据包括原始数据和推断的数据。数据的认知范围有限,所以数据可解释的范围就有限。模型是对数据信息的汇总,由于数据信息有限,所以模型可解释的程度也有限。超出模型可解释的程度,就是对模型进行一系列的假设。大数据方法研究需要多学科的联合,统计学家需要关注实时决策和计算机资源,计算机学家需要了解算法和统计推断的复杂性。

3 大数据时代对统计数据质量的影响

3.1 大数据时代对数据时效性的影响

库克耶和舍恩伯格认为:大数据不用抽样调查的方法,而用所有数据的方法。数据科学家甚至提出“样本=总体”,这或许意味着统计工作重心要转移。舍恩伯格和库克耶认为抽样调查有很多自身的不足:一是样本的随机性很难实现;二是不适合考察有子类别的情况;三是采样忽略了细节的考察,而大数据分析则可以弥补抽样调查的这些不足之处。如果说之前统计工作的重点在于数据搜集和整理,那么大数据时代统计工作的重心就是如何搜集整理分析有用的信息。这样一来,已经得出的数据结论可能不具有这个时代的特点,即失去了时效性。

3.2 大数据时代对数据真实性的影响

大数据时代除了对数据的时效性有影响之外,对数据的真实性也有影响。由此,当通过网络搜集数据时,首先需要考虑的是,数据是否是由自动化算法系统产生?如果是,究竟有多少?以淘宝网为例,大量的虚假评论已经影响了信息的真实。

4 大数据时代统计工作的应对之策

大多数的研究指出,当前统计方面存在的问题在于业务部门没有利用好大数据导致数据资源缺乏;企业内部信息孤岛导致数据的有效信息无法充分利用;工作人员数据分析能力差导致大数据时代下统计工作很难进行。

4.1 国家应对之策

在大数据时代下,要保障统计数据质量,国家应当做到以下几点:

(1)尽快改革当前统计管理体制的制约,保证统计独立调查、独立报告、独立监督的职权不受侵犯。在大数据时代,统计体制改革要与时俱进,尽快建立符合我国国情的统计管理体制。

(2)充分发挥党委政府的主导作用,赋予各其统计数据质量的主体责任。要发挥各级地方党委政府对本区域统计数据质量的主体责任,将统计数据质量的好坏作为考核一个地区领导业绩的主要方面之一。

(3)尽快建立引导一个提速增效的统计考核评价指标体系,完善党政领导的绩效考评机制。

4.2 企业应对之策

企业应做到以下几点:信息以数据形式呈现,强化建设数据标准;融合结构化和非结构化数据;推广应用大数据,促进使用信息资源;重视数据的安全管理。

4.3 个人应对之策

统计学家必须积极学习新事物,适应大数据环境,拓展统计学的应用领域,创造出新的统计方法。大数据时代带给我们的挑战与机遇并存。

主要参考文献

[1]朱建平,章贵军,刘晓葳.大数据时代下数据分析理念的辨析[J].统计研究,2014(2).

[2]郑京平,王众全.官方统计应如何面对BigData挑战[J].统计研究,2012(12).

[3][英]维克托・迈尔-舍恩伯格.大数据时代――生活工作与思维的大变革[M].周涛,译.杭州:浙江人民出版社,2013.

[4]Brian Hopkins,Boris Evelson.Expand Your Digital Horizon with Bigdata[N/OL],2011-09-30.

[5]邱东.大数据时代对统计学的挑战[J].统计研究,2014(1).