测算方法论文

时间：2023-03-21 17:04:45

导语：在测算方法论文的撰写旅程中，学习并吸收他人佳作的精髓是一条宝贵的路径，好期刊汇集了九篇优秀范文，愿这些内容能够启发您的创作灵感，引领您探索更多的创作可能。

测算方法论文

第1篇

关键词：练习设计；形成性作业；障碍诊断；“减负增效”科学化

文章编号：1005–6629（2014）2–0003–04 中图分类号：G633.8 文献标识码：B

作业这个词在我国教育教学领域广为使用始于上世纪50年代“学习苏联”之后。在俄语词汇中，作业（задание）还有功课、任务的意思，它的同词根词задача则是任务、习题的意思。упражнение也有作业的意思，但主要指练习作业和习题。在苏联教育学中，学生的实验室作业和实习作业是作业的重要类型。由此，通常认为作业是指要求学生在一定时限内完成的学习性的活动任务，它包括练习以及以解决问题为主的设计及实践活动。可见，作业不仅仅是练习，两者之间是有些区别的。但是，时至今日，作业一词在我国似乎成了练习的代名词，加上基础教育的特点和教学时间等条件的限制，中学化学教学中的作业是以练习为主的，大量的是练习，通常所说作业设计实际上是指练习设计，实验室作业和实习作业大多用实验（活动）和实践活动来分别指称。本文在讨论作业设计时，相应地以练习设计为主，用意在于突出对练习设计改进的研究。

2005年，笔者曾经概括化学新教材中练习设计和练习教学的主要问题，并就存在问题的解决提出了一些意见[1]。然而8年之后，就总体情况而言，教材练习设计与教学实际“两张皮”，各搞一套，形成巨大落差的现象依然存在。而且，应试压力越来越大，许多教师在练习教学中追求“一步到位”，达到新的程度；“题海恶浪”使学生苦不堪言，许多教师也无可奈何；少数人对“造海”和编造难题颇为得意，却没有重视练习异化的严重威胁日益临近：学生摔书、弃学事件频发，“读书无用论”重新泛起，“取消化学学科升学考试”的趋势日益明确……“物极必反”，先人总结的这个规律，应该唤起我们的警醒。不错，考试还是要的，恰当的应试教学是需要的，改革有关制度也不是教师所能决定的，但这并不意味着教师可以因循守旧，维持现状，无所作为，依然按旧认识、旧经验办事。我们都希望化学教育搞得更好，都不希望化学教育受到影响，因此，每一个教师都必须深入地思考和探索如何消除痼疾，如何在教师职责范围内改革应试和练习教学，努力实现“减负增效”。

笔者认为，要实现练习教学减负增效，除了要坚持整体规划，系统设计，逐步提高，积极创新之外，当前应着重解决好下列问题：

1 合理定位，注意跟课文融合

总的来看，目前教材的编写仍存在重“学”轻“习”、“学”“习”分离现象，对课文编写比较重视，练习编写有时只是起点缀作用，缺乏深入、有效的练习指导，助推了实践中各行其是。

实际上，练习属于问题之列，跟教材或者课堂教学中设置的问题没有本质的区别。有计划的、恰当编制的跟课文融合的练习不但能巩固、拓展、深化学生的知识技能，培养学生的能力，也能使学生在情感态度价值观方面得到发展，具有促进学生发展的功能。通过练习还可以获得教学反馈信息，利于教学调控，促进预定教学目标的实现。练习过程也是学生继续学习的过程，是学习过程的一个重要环节。

由此可以将练习合理地定位为：它不仅是“习”，也是“学”的重要方式和组成部分；要重视教材中练习的编写，加强练习指导，使它跟课文有机地融合，做到“学”中有“习”，“习”中有“学”。在教材中练习的编写尚未得到改善时，教师在教学设计中可以做出适当的补充和调整。

2 有的放矢，重视练习的“形成”本性

在应试需要的驱使下，不少教师把练习变成了“做卷子”的过程，仿照终结性考试的编制方法来编制平常的教学练习，使练习丧失了应有的基本属性——形成性。久而久之，一些教师甚至不知道如何有效地编制形成性练习了。因此，重视和体现练习的形成本性，针对学生的薄弱环节，有的放矢地促进“形成”是十分重要的。

2.1 前提：准确诊断

最有效的“形成”，是有的放矢的“形成”。为此，除了要研究和遵循学生学习各具体内容的一般规律外，还需要做好学习困难和障碍的诊断。

思维的过程就是解决问题的过程，学习困难大多出现在解决问题的过程之中，它们的主要类型有：基础较差型（包括知识缺失型、程序缺陷型等）；能力较弱型（包括策略无效型、经验贫乏型、思维缓慢型、不太熟练型等）；元认知失衡型（包括元认知缺乏型、注意不当型、缺乏反思型等）；以及情意问题型（包括信心不足型、害怕困难型、心不在焉型、易受干扰型）等。

进行学习困难和障碍诊断的方法主要有：基于任务分析的个别谈话、概念图表达、思维路线陈述、出声思维、行为观察以及诊断性作业等等。

2.2 关键：对“症”处理

在明确学习困难和障碍类型之后，可以用不同类型的作业配合其他方面的措施，作对“症”处理。例如：

对于知识缺失型，可以通过补救型作业、拓展型作业、应用型作业进行知识“补课”；通过分解型作业促进理解；通过对比型作业突出条件、特点；通过变式型作业促进对核心、本质、重点的掌握；通过强化型作业促进知识巩固。

对于程序缺陷型，可以通过矫正型作业、补救型作业纠正程序错误；通过诱错型作业消除错误定势、引起警惕。

对于策略无效型，可以通过分解型作业和综合型作业结合，促进对策略的理解；通过观念的方法论内涵演绎与样例示范促进策略的思考和累积；丰富题型知识，注意题型体验。

对于经验贫乏型，可以通过变化型作业、拓展型作业、应用型作业来充实、丰富经验。

对于思维缓慢型和不太熟练型，通过归纳型作业，以及有序和适当地增加练习量，以促进形成“图式*”，有利于思维提速和熟练解题过程。

对于元认知缺乏型，可以通过解说型作业，要求学生解说解题依据及过程，学习反思和换位换向思考，强化其元认知意识、知识和体验。

对于情意问题型，应以心理矫正方法为主，也可以应用激趣型作业、应用型作业、动手型作业来配合。

对于注意不当型，可以通过强化策略意识，改善情意心理来提高注意品质。

上述各种类型的作业都是针对学生薄弱环节的“形成性练习”，广义地说，这种“形成性练习”也包括诊断性作业在内。除此之外，还有不具有特定目的、旨在进行常规教学训练的“形成性练习”，下面讨论中的举例即可归属于此类。

3 划分层次，逐步“到位”

教学中的练习应该是由若干习题构成的有机整体，而不是若干习题的随意拼凑，应该根据预期功能赋予适当的层次结构：或者是变式重复，以求巩固、强化；或者逐步拓展，以求发展；或者是逐步深入，以求提高。

课时练习跟单元练习、学段练习以及升学应试练习要注意拉开档次，明确分工，不能“一步到位”。为此，需要先做好整体计划，并注意有计划地覆盖基本的题型。

对于学习基础不同、学习速度各异的不同类型学生，应该通过练习选择指导，分类提供适合他们的练习，使他们都能逐步发展、提高。

恰当地划分习题的层次是按照上述内容搞好练习教学的重要前提。怎样合理地给习题划分层次呢？通常可采用的方法主要是：

3.1 参照布鲁姆教育目标分类体系划分习题层次

在B. S.布鲁姆提出教育目标分类法之后，曾任美国《Journal of Chemical Education》总主编的列品考特（W. T. Lippincott）教授等人就用来对化学试（习）题进行过分类。1987年，笔者曾经借鉴布鲁姆的分类思想、指导原则和编制方法，根据解答问题时需要涉及的认知操作，将中学化学试（习）题分为知道、领会或学会、应用、综合运用和创新等层次，测量它们的实际难度，发现这个认知序列跟难度增长有着很明显的相关性[2]。据此，可以参照布鲁姆的教育目标分类体系把习题区分为不同的层次（见表1）。

3.2 利用SOLO分类体系划分习题层次

SOLO（Structure of the Observed Learning Outcome，意为可观察的学习成果的结构）分类评价理论是由比格斯（J. B. Biggs）及其同事提出的。其基本观点是：儿童的心理发展在不同的学科中有不同的表现，具有阶段性的特征，同一个学生甚至在同一个学科的不同知识点上都会处于不同思维阶段。教学不仅要关心学生的认知发展阶段，更要关注学生的真实学习情况，寻找学生学习质量出现差异的原因，以便“因材施教”促进学生的发展。他们把学生在学习新知识过程中表现出来的可以观察到的思维阶段称为“可观察的学习成果结构”，根据学生解答具体问题时表现出的思维结构在性质和抽象水平上的复杂变化，假设学生在学习时存在由感觉运动的、形象的、具体符号的、形式的、后形式的5种方式依次组成的普遍发展顺序，并进而描述了每种方式下的反应水平，把学生的学习结果由低到高划分为前结构的、单一结构的、多元结构的、关联结构的和拓展抽象结构的5个层次[3]：

（1）前结构水平（Prestructural）：学生被情境中无关的方面及以前所学的无关知识所困扰或误导，没有真正理解问题，不了解相关知识，或使用过于简单的方法去解决问题，表现为任务没有得到合理地处理，回答问题时逻辑混乱，给出错误的或不相关的答案。这是最低级的水平，可认为学习者不具有回答该问题的能力。

（2）单一结构水平（Unistructural）：学习者只能联系与该问题相关的单一事件，找到一个线索或资料就立即得出结论，忽视了可能的内在矛盾，或者仅仅是靠记忆回答，而不是真正理解。

（3）多元结构水平（Multistructural）：学生回答问题时，能联系多个孤立事件，使用两个或多个线索或资料，但未能觉察到这些线索或资料之间的联系，未能对线索或资料进行有机整合。常常给出一些支离破碎的信息，未形成相关问题的知识网络。

（4）关联结构水平（Relational）：学习者能够把握问题线索和相关素材及它们之间的联系，进行概括归纳，将它们联结在总体的联系框架中成为一个有机整体，能解决较为复杂的问题，并将解答的各部分内容整合起来，使之具有统一的结构和意义。这表明学习者已对这个主题有充分的理解。

（5）拓展、抽象结构水平（Extended abstract）：学习者能概括一些抽象特征，把前面得到的整体概念转化到更高的抽象水平，或者拓展问题本身的意义，推广这个结构到一个新的主题或领域，表现出较高的创新能力。

以这个5层次发展序列为标准，可以把习题划分为不同水平（见表2），根据学生在解答问题时的表现来判断他所处的思维发展阶段。这就是说，SOLO法可用于形成性的学生学业评价。

4 探索负荷测算方法，实现“减负增效”科学化

要科学地“减负增效”，需要对负荷进行测算，而不是只凭主观感觉“毛估估”。

澳大利亚心理学家约翰·斯威勒（John Sweller）在1988年提出认知负荷理论[5]。他认为，学习过程中的各种认知活动都需要消耗认知资源，如果所需要的认知资源总量超过了个体所具有的认知资源总量，存在认知资源分配不足的问题，会出现超负荷现象，从而影响学习效率和质量。认知负荷包括内在认知负荷、外在认知负荷和关联认知负荷。内在认知负荷与学习材料的性质关联，是由所学材料本身的复杂程度决定的，在信息要素高度交互作用以及学习者还没有有效掌握合适图式时，会产生高度的内在认知负荷。外在认知负荷是由信息的呈现方式和学习者需要的学习活动所引起的，它主要是由设计不当引起。关联认知负荷是指与促进图式构建和图式自动化过程相关的认知负荷，它也受控于设计者。外在和内在认知负荷不利于学习，而关联认知负荷有利于学习。认知负荷理论在20世纪90年展成为研究认知过程和教学设计框架的一个重要理论，但学者们对其涵义的理解始终没有统一[6]。

目前在管理研究领域，国际上有关脑力负荷的研究方法主要有：主任务度量法、次任务度量法、生理度量法和主观度量法。其中，主任务度量法是通过对操作者在工作中的表现来推算这一工作强加于操作者的脑力负荷，有很明显的缺陷；次任务度量法通过对操作者完成次要任务时的表现来推算，受到的质疑更多；生理度量法目前的可靠性不强而且依赖于多种特殊仪器、难于广泛应用；主观度量法则永远无法完全消除其主观性[7]。

笔者认为，在练习设计中对习题的主任务进行结构分析，有可能表征其复杂性，由此可以确定习题的静态难度（或称绝对难度）和推测学生的认知负荷极限，并进一步确定习题的层次。

试（习）题难度的标定方法大致可以分为采用客观指标的事后标定和主要采用主观指标的事前标定两大类型。事后标定大多以通过率或者得分率作为试（习）题的难度，在测验评价和试卷分析中已经广泛应用。对于试（习）题编制及其难度调控来说，事前标定难度比事后标定难度似乎更有直接意义，但是事前标定实际难度的困难要比事后标定大，其主观性也比事后标定大。目前，国内外都有不少学者在探索如何更好地进行试（习）题难度的事前标定，尝试根据影响因素来标定问题的绝对难度；提出了各种绝对难度标定方法，如多维度分析系统、任务加工信息数量评估法、认知复杂性评估法、认知任务分析法和关系-表征复杂性模型等等[8，9，10，11，12]。

一般说来，试（习）题的难度与其复杂性有关，对其复杂性系统地作具体分析，有助于确定影响试（习）题难度的主要内在因素并进而测算其量值。问题是由基质（或称预设、主题、已知等）、疑项和解3部分组成的，并且往往在一定的背景下产生，用适当的语言表述，在一定的情境中呈现。由此可以推测影响试（习）题难度的各种因素包括下列各方面：

（1）问题表述的准确性和鲜明性；阅读量大小。

（2）情境的复杂性；情境与问题以及学生认知经验的贴近程度，对建模以解决问题的启发性、便利性。

（3）基质（已知条件）中包括模块和图式在内的知识点的多少、隐蔽性、充分必要性；各知识点的关联复杂性。

（4）疑项和解的多少；已知条件与解之间的障碍与干扰的多少；中间任务或中间目标的多少（任务的复杂性）。

（5）解的开放性、指向性（搜索空间大小）。

（6）问题结构的多元性、关联性、拓展性以及要求的抽象-具体跨度大小。

（7）问题解决过程必须的策略及程序的复杂程度和熟悉程度，认知操作水平、逻辑操作数量，等等。

情境越复杂；试（习）题涉及的知识点（或知识组块）越多，知识的学习（应用）水平要求越高；任务复杂性越大、中间任务（阶段任务）越多；条件的隐蔽性和结论的开放性越大，障碍与干扰越多，问题的结构越复杂；解的指向性越弱，可采取的策略（图式）和程序越复杂，都会使试（习）题的难度越大。

不过，上述推测不一定可靠，需要经过实践检验和修正，只能作为研究过程中的一个假设。例如，一般推测知识内容模块个数会影响试（习）题难度，然而有人在实证研究中发现：知识内容模块个数对试（习）题难度并没有显著的影响，达不到统计检验的显著性水平[13]。

确定影响试（习）题难度的主要因素不是一件容易的事，由这些因素来建立模型准确地测算难度数值也不轻松。

5 需要解决的其他问题

除了合理定位，跟课文融合；有的放矢，重视练习的“形成”本性；划分层次，逐步“到位”；探索负荷测算方法，实现“减负增效”科学化之外，心怀精品意识，努力把练习和习题设计成精品，绝不苟且应付，对于搞好作业设计非常重要、非常关键！

还有一些问题也需要注意和解决。例如，一些教师总感觉到课本中的习题“不给力”，其原因在于大多数仍停留在表面，运用知识分析解决实际问题少，导致学生兴趣低下、缺乏主动性、对练习持应付态度、抄袭作业现象严重；随手拼凑练习多、重复多，选择题数量过度，造成“题海”高耗低效；注重学科特点不够，胡乱编造的“实际”题时有出现……在练习教学方面，教师讲评枯燥、狭隘，重结果轻过程，忽视知识构建，忽视思维培养，缺乏方法、策略训练，不注意透过现象看本质，难以达到举一反三效果；忽视个别指导，缺少有效的矫正和补救措施，加剧了学习分化……实践表明，文化内涵贫乏、人文精神缺失，会严重地牵制练习和练习教学水平的提高。

“减负”只是努力的一个方面，另一方面，还要从指导思想、教学原则以及练习的内容、形式和教学实施、批改、讲评等环节努力“增效”。限于篇幅，这里就姑且从略了。

参考文献：

[1]吴俊明，李艳灵.关于高中化学新教材练习设计和练习教学的思考.载于：课程改革的探索之旅——《课程·教材·教法》创刊30周年百篇精粹[M].北京：人民教育出版社，2011：561～565.

[2]吴俊明，王槐.试论中学化学教学目标的分类[J].扬州师院学报自然科学版，1987，（4）：99～104.

[3] John B. Biggs，Kevin F. Collis.Evaluating the Quality of Learning——The SOLO Taxonomy [M]. NY： Academic Press，l982.

[4]薛春兰. SOLO分类评价理论在高一化学教学中的应用[J].化学教学，2012，（12）：28～30.

[5] Jobn Sweller. Cognitive Load During Problem Solving： Effects on Learning [J]. Cognitive science， 1988，（12）：257～285.

[6]赵俊峰.解密学业负担学习过程中的认知负荷研究[M].北京：科学出版社，2011.

[7]崔凯，孙林岩，冯泰文，邢星.脑力负荷度量方法的新进展述评[J].工业工程，2008，11（5）：1～5.

[8][13]杜明荣.高中物理试题难度的影响因素研究[D].重庆：西南大学硕士学位论文，2008.

[9]邵志芳，余岚.试题难度的事前认知任务分析[J].心理科学，2008，31（3）：696～698.

[10]李二霞，邵志芳.试题难度多项指标的认知任务分析[J].心理科学，2009，32（6）：1342～1344.

第2篇

关键词：统计测度；统计学；大数据；数据科学；

作者简介：李金昌，男，50岁，浙江义乌人。浙江财经大学校长，统计学教授，博士生导师。研究方向为经济统计学，统计理论与方法，抽样技术，政府统计等。

最近两年，统计学界对大数据问题所进行的理论探讨逐渐增多，视角也各有千秋，引起了一些共鸣。围绕大数据问题，由统计学、计算机科学、人工智能、数学等学科共同支撑的数据科学开始形成。但大数据毕竟是一个新课题，因此远未达到对其有一个系统完整的认识，仍然需要从不同的方面加以研究，其中有一个重要但又容易被忽视的问题，即统计测度问题，值得去探讨。

一、什么是统计测度

汉语上，测度是指猜测、揣度、估计。数学上，测度是一个函数，它对一个给定集合的某些子集指定一个数，这个数可以比作大小、体积、概率等等。通俗地说，测度把每个集合映射到非负实数来规定这个集合的大小：空集的测度是0；集合变大时测度至少不会减小(因为要加上变大的部分的测度，而它是非负的)。

除了数学角度的测度论，查阅国内文献资料，带有测度这个词汇的文献不少，但专门针对统计测度(或测度)内涵的讨论几乎没有。一些对社会经济现象进行分析测度的文献，例如新型工业化进程测度、货币流动性测度、全面小康社会发展进程测度、收入分配公平性测度、技术效率测度、人力资本测度、金融风险测度、产业关联测度等等，所做的测度都是再测度，均不对测度本身进行讨论。查阅国外文献资料(关键词：measurement)，也同样存在这样的问题，只能收集到一些比较零散的表述。LudwikFinkelstein(1975)[1]认为，在我们对事物或现象进行描述时，测度可以被定义为对现实世界中某一现象的个体属性或特征进行量化的过程。JamesT.Townsend和F.GregoryAshby(1984)[2]认为，如果按照极端的观点，那么统计分析中的基本测度理论的含义仍然是存在争议的。LudwikFinkelstein(2003)[3]指出，测度在那些原来尚未得到卓有成效或广泛应用的领域，也已取得了明显的进步，社会、政治、经济和行为科学正在更大程度地利用定量技术；测度是现代思维的一种实际有效的工具，是我们借以描述世界的一种方法。GiovanniBattistaRossi(2007)[4]认为，用以表示测度结果的，是数字或者数字符号。LucaMari(2013)[5]认为，测度的基础特征是被公认为世界上获取并正式表达信息的基本方法，这让它成为一种跨学科的工具。LudwikFinkelstein(2014)[6]指出，在自然科学技术中，测度的重要性不可否认，它是科学调查和发现必不可少的工具，它可将宇宙中的复杂现象用精确、简洁和普遍的数学语言来描述。

那么，到底什么是统计测度呢？目前没有一个统一的定义。本文认为，统计测度具有不同于测度的意义，并且大大超越数学上的界定，即它具有数学定义的一般属性，但又不受制于函数表现形式，因为统计测度所要面对的是现实世界，实际问题要比理论上可以定义的问题复杂得多。按照我们的理解，统计测度就是用一定的符号和数字，用一定的形式和载体，对所研究的现象或事物的特征进行量化反映，表现为可用于统计分析的数据的过程。它应该具有这样一些属性：以实际现象为测度对象，测度结果具有实际意义；以量化为目的，把信息转化为数量，提供人们容易理解的定量结论；个体特征的测度符合形成总体定量结论的要求，同时能够体现个体差异。可以发现，统计测度需要借用数学工具，但更重要的是对具体测度现象本质特征的认识和掌握。

统计测度可以从若干不同角度进行分类。邱东教授(2012)[7]曾在“宏观测度的边界悖律及其意义”一文中，从边界的角度对宏观测度进行了分类：一是因事物本身可测度性而形成的边界，即本体论意义上的测度边界；再一是由人的认知能力而形成的边界，即认识论意义上的测度边界；第三则是由统计相关性偏好和投入约束而形成的边界，即操作意义上的测度边界。这三条测度边界，应该以本体论意义的测度边界最大，认识论意义的测度边界次之，而操作意义的测度边界最小。这样的分类，对于我们正确理解统计测度的内涵很有帮助。受此启发，笔者认为统计测度还可以有如下分类：

1.从测度的实现形式看，可以分为原始测度和再测度。原始测度也可以称为直接测度，它通过对测度对象进行直接测度来获取数据，例如清点库存物品数量、丈量作物播种面积、观察培育细菌数目、检测药物成分等获得的数据，以及各种登记、记录的原始数据等等。再测度也称为间接测度，它以其他已知的测度数据为基础去计算、推算或预测所需的未知数据，例如根据GDP和人口数测度人均GDP、根据人口普查分年龄人口数据测度老龄化系数和社会负担系数、根据相关指标数据测度CPI的变化等等。复杂的再测度则需要借助相应的统计模型作为工具，因为它实际上是对相关变量之间的关系进行定量反映。从两者关系上看，原始测度是基础，是根本，没有科学的原始测度就不会有可靠的再测度；再测度则是测度功能提升的必然要求，以解决原始测度不能解决的问题。

2.从测度的计量方式看，可以分为自然测度、物理测度、化学测度、时间测度和价值测度。自然测度是利用现象的自然属性所进行的一种统计测度，例如人口规模、企业数量等的测度，采用自然计量单位；物理测度是利用现象的物理属性所进行的一种统计测度，例如公路长度、作物播种面积、天然气产量等的测度，采用物理计量单位；化学测度是利用现象的化学属性所进行的一种统计测度，例如医学、生物学中化学合成物的成分结构测度，采用百分数、千分数或特定标识为计量单位；时间测度是利用现象的时间属性所进行的一种统计测度，例如劳动用工、闲暇时间等测度，采用时间计量单位；价值测度是利用现象的价值属性所进行的一种统计测度，例如劳动报酬、经济活动成果等测度，采用货币计量单位。在这些测度计量方式中，价值测度因最具有综合功能而应用最为广泛。

3.从测度的方法看，可以分为计数测度、测量测度、实验测度、定义测度和模型测度。计数测度是一种通过观测计数来获得数据的方法，最为简单，一般用于自然测度或时间测度；测量测度是一种根据物理或化学规制对现象进行测量、测算来获得数据的方法，一般用于物理测度或化学测度；实验测度是一种按照科学实验原理、通过观察实验对象在既定条件下的反应来获得数据的方法，一般与测量测度相结合，用于获取科学研究数据；定义测度也可以称之为指标测度，是一种通过探究现象的本质特征和活动规律、归纳出表现其数量特征的范畴、给出统计指标定义(包括内容、口径、计算方法和表现形式等)来获取数据的方法，最常用于价值测度，也用于其他形式的测度。可以说，定义测度方法应用最为广泛，但也最为困难。模型测度是一种根据现象与现象之间的内在联系关系、或者现象自身的发展变化规律，通过建立一定的方程模型来获取数据的方法。前面三种统计测度方法基本上都属于直接测度，定义测度既可能是直接测度、也可能是间接测度，而模型测度都属于间接测度方法。

4.从测度的维度看，可以分为单一测度与多维测度。单一测度是指采用单一的方式方法对所研究现象或事物进行单一角度的测度，获得单一的数据。多维测度是指对所研究现象或事物进行多角度的测度，测度过程中可能需要采用多种测度方法和计量方式，例如多指标综合评价就需要借助统计指标体系对评价对象进行多角度的测度。显然，单一测度是多维测度的基础。

二、统计测度是统计学的立足之本

首先，从统计学的发展历史看，是统计测度使统计学破茧而出。为什么主流观点认为政治算术是统计学的起源而不是国势学？正是因为威廉·配第首次采用统计测度的方式进行了国家实力的统计分析和有关推算，得出了令人信服的结论。威廉·配第在1693年出版的《政治算术》[8]中写道“因为和只使用比较级或最高级的词汇以及单纯作思维的论证相反，我却采用了这样的方法(作为我很久以来就想建立的政治算术的一个范例)，即用数字、重量和尺度的词汇来表达我自己想说的问题，只进行能诉诸人们的感官的论证和考察在性质上有可见的根据的原因”，这一观点在统计学的发展过程中产生了非常重要的影响。他的这段话虽然没有出现测度一词，但却道出了测度的本质，即让事物变得明白、变得有根据，因为“数字、重量和尺度”就是测度、就是根据，用“数字、重量和尺度的词汇来表达想说的问题”就是一种测度的思想，尽管测度的方式方法还很简单。相反，国势学虽然提出了归纳法这一统计学的基本方法并首创了统计学一词，但由于没有采用统计测度的方式进行国势问题的研究而难以修成正果。正如邱东教授[7]所说：“在配第之前，统计学的研究对象虽然是国家的态势，但它在方法论上只是定性言说。一个国家的财富总量在本体论意义上是可以测度的。然而只是到了配第时期，人类才想到了要测度它，并发明了如何测度的基本方法。政治算术，即开创期的经济统计学，实现了从无到有的转变，大大扩展了宏观测度的认识论边界，因而才具有了统计学范式创新的革命性意义。”同样，格朗特的《关于死亡表的自然观察和政治观察》也是人口统计测度方面的经典之作，无论是原始测度还是再测度，都给后人留下了宝贵的财富。之后，统计学就是沿着如何更加科学、准确测度世界这一主线而发展的。笔者曾在“从政治算术到大数据分析”一文[9]，对数据的变化与统计分析方法的发展进行了粗浅的归纳，其主题实际上就是统计测度问题。

其次，从统计学的研究对象上看，统计测度是体现统计学数量性特征的前提条件。统计学的研究对象是现象的数量方面，或者说统计学是关于如何收集和分析数据的科学。统计数据从何而来？从统计测度中来。数据不同于数字，数字是统计测度的符号，数据是统计测度的结果，这也正是统计学区别于数学之处。所以说，数据的本质问题就是统计测度问题，故此统计测度是统计学的基本问题。这里重点讨论两个问题：一是统计测度与统计指标的关系，二是统计测度面临的新问题。关于第一个问题，本文认为统计测度与统计指标是一个事物的两个方面，这个事物就是数据。统计指标法是统计学的基本方法之一，尽管前面对统计测度从方式方法上进行了分类，但从广义上说所有统计测度都是定义测度，都表现为指标。也就是说，任何统计测度———不论是直接测度还是间接测度，最终目的是获得能够让人明白的数据，而表现数据的最主要形式就是统计指标，其他表现数据的形式都是派生出来的。所以，统计测度就是根据所设定的统计指标去获得所需的数据。关于第二个问题，与后文所要论及的大数据有关，就是定性测度问题。在统计学中，数据可以分为两类———定性数据与定量数据，其中定性数据又包括定类数据与定序数据两种，它们属于非结构化或半结构化数据。相应地，统计测度也可分为定性测度与定量测度。很显然，只有定性测度与定量测度方法得到同步发展，统计学才能更加完善。总体上看，定量数据的统计测度已经比较完善，但定性数据的统计测度还有很多问题尚待解决，难点就在于测度的切入点———如何提取有效的信息、如何最终转化为统计指标。尽管关于定性数据分析的论著已经不少，但还没有从理论方法上建立起定性数据统计测度的体系，因此统计学在这方面的任务依然很重。

第三，从统计学的永恒主题看，通过科学的数据分析、得出有效的结论是其不变的追求，而数据分析过程就是综合的统计测度过程。获得数据的目的是为了发现隐含其中的有价值的信息，即发现数据背后的数据，让数据再生数据，从而满足人们认识事物、掌握规律、科学决策的需要。除了总量、结构等基本信息外，更重要的是通过数据分析来呈现现象的变化规律与相互关系。不难发现，这种数据分析的过程，就是不断进行各种统计测度的过程，所以最终的统计分析结果实际上就是各环节、各方面的各种类型的统计测度的叠加结果，或者说是统计测度不断放大的过程。大量针对社会经济现象进行分析研究的文献(不论是否冠以“测度”两字)，只要有数据分析，都是如此。可以说，统计测度贯穿于统计数据分析的全过程。但是，为什么很多统计数据分析并没有得出有效的结论呢？本文认为原因就出在统计测度上，尤其是没有首先解决好原始统计测度问题。应该说，围绕数据分析已经建立起一整套比较完整的统计方法体系，很多方法也都身经百战、行之有效，但一旦原始统计测度有问题、数据不准确或不真实，那么任何方法都只是摆设。仔细研读很多所谓的实证分析文献，其重点均在于构建什么样的模型或运用什么样的方法，虽然有的文献也必须要讨论选择什么样的变量(指标)这个问题，但并不是系统地从测度的角度进行阐述，因此所用的模型越来越复杂，但所得的结论却离实际情况越来越远。学界总是有这样一种观念：变量越多、符号越新奇、模型越复杂的文章才越有水平，似乎这样分析所得的结论才越可靠。殊不知，不以科学可靠的原始统计测度为基础，任何数据分析都会成为无源之水、无本之木，所得的结论也只是更精确的错误而已。本文认为，任何脱离科学统计测度的统计分析都是毫无意义的，充其量是一种数字游戏而已。应该树立这样一种观念：科学的统计数据分析首先取决于科学的统计测度，而不是首先取决于什么样的分析模型，虽然模型也很重要。这也再一次证明，统计测度问题是统计学的根本问题。其实，归根结底看，在统计数据分析过程中，每一步分析都以前一步的测度为原始测度，每一步所用的方法都是统计测度方法，因此所有的统计分析方法都是统计测度方法。甚至可以说，统计学方法体系就是统计测度方法体系。

当然，在实际的统计分析中，统计测度往往遇到一些困难，即有些指标数据由于各种原因无法获得，这就不得不采用替代这种途径。例如，绿色GDP核算的概念已经提出很多年，但为什么还没有哪个国家真正公布绿色GDP数据，原因就是自然资源价值、生态环境价值等的统计测度目前还面临着很大的困难，其背后存在着一系列有待进一步研究和解决的理论与实践问题，因此不少学者进行了替代测度的探讨。这一方面说明统计测度的重要性，另一方面说明统计测度替代的无奈性。但是，替代测度必须遵守相应的规则与逻辑，要经得起推敲。有的文献明明知道有关变量无法测度、有关数据无法获得，却随意地、不符合逻辑地进行所谓的替代，结果是最后的结论不知替代成什么样了，很难理解它的意义。关于替代测度的有效性问题，邱东教授[7]已有精辟的论述，在此不再展开讨论。

三、统计测度是数据科学的基础

笼统地讲，数据科学就是以大数据为研究对象的科学，需要多学科交叉融合、共同支撑。由于大数据是快速增长的复杂数据，因此大数据分析仅有统计思维与统计分析方法是不够的，还需要强大的数据处理能力与计算能力。只有把统计思维、统计方法与计算技术结合起来，才有可能真正挖掘出大数据中的有价值信息。本文认为统计思维、统计方法与计算技术相结合的基础就是科学的统计测度。

首先，大数据技术不能自行解决其计算和分析应从何处着手的问题。现代信息技术与互联网、物联网技术的快速发展，使人类进入大数据时代，也有人说进入到数联网时代，这意味着我们一方面被各种越来越多、越来越复杂的数据所包围，另一方面又被数据中巨大的信息价值所吸引，想从中挖掘出可供决策之用的信息。如何挖掘大数据？人们已经进行了艰苦的探索，发展了很多专门的方法技术，并已尝到了不少甜头，但远未达到充分利用大数据中有效信息的目的，因为已有的大数据分析研究主要集中于计算机科学与技术、软件工程、计算数学等领域，重点是计算能力与算法研究，而很少从统计学的角度进行有针对的探讨，还没有真正进入数据分析的深层。这里面实际上忽略了最基础的统计测度问题。如果说，计算技术的发展能够解决数据储存与计算的能力问题，算法模型的改进能够解决大数据分析的综合能力问题，那么它们仍然不能解决对谁进行计算与分析的问题，也即从何处着手的问题。无论是传统的结构型数据，还是现在的包含大量非结构型数据的大数据，要对它们进行分析都必须找到正确的切入口，即分析的基本元素是什么，或者说需要测度什么。当然，还有如何测度的问题。然后，才能进行分组、综合和构建模型，否则大数据分析不会达到人们的预期。

其次，大数据之所以催生数据科学，就是为了通过多学科交叉融合来共同解决大数据分析中存在的问题，其中包括统计测度问题，这一点对于非结构化数据尤为突出。实际上，大数据的本质就是非结构化数据，一是体量大、比重高(超过95%)，二是变化快、形式多，三是内容杂、不确定。通过各种社交网络、自媒体、富媒体，以及人机对话和机器感应记录等产生的各种非结构化数据，例如各种文字、各种表情符号、各种声音、各种图像，到底表示什么？综合在一起能体现什么规律？如何综合各种信息？存在着大量有待研究的问题。其实，文字的长短、用词、表达形式(叙述式、议论式、散文式、诗歌式，等)甚至字体大小与颜色，表情类型与偏好，声音高低、频率与情绪，图像颜色等等，都是有特定意义的，即在特定环境条件下的反应。所以，一句话或一段声音的意义并非文字本身的意思，一个表情符号的意义并非符号表征的意思，一个图像的意义并非图像内容与色彩本身的意思，因为背后有太多的未知。人们浏览检索各种信息的习惯、收看与回复邮件等信息的习惯、参与信息网络的习惯、购物习惯与支付习惯等等，也是如此。更何况，同样的网络词汇在不同的时间代表着不同的语义。这背后隐藏着的是人们的行为与社会关系，既具有个性又具有共性，极其复杂。所以对这样的数据进行分析，首先绝非是计算问题，也不是用什么模型问题，而首先是从何处着手、如何选取关键词、如何选定关联词、可以用什么样的指标来综合、可以用什么样的表式来表现等问题，一句话就是统计测度问题。非结构化数据的统计测度将主要是定义测度，这些问题不解决，分析模型也是难以构建的，或者难以得出令人信服的结论。

例如，关于《红楼梦》前80回与后40回是否同一作者的争论，韦博成[10]进行了综合性的比较研究并提出了自己的观点，他指出已有美国威斯康辛大学华裔学者陈炳藻教授(1980)[11]、我国华东师范大学陈大康教授(1987年)[12]和复旦大学李贤平教授(1987年)[13]等学者从统计学的角度进行过专门的研究，但却得出了不同的结论：陈炳藻教授认为前80回与后40回均是曹雪芹所著；陈大康教授认为前80回与后40回为不同人所著；李贤平教授认为前80回是曹雪芹根据《石头记》增删而成，后40回是曹雪芹亲友搜集整理原稿加工补写而成。此外，还有其他一些学者进行过类似的研究，也有一些不同的结论。为什么都通过提取关联词和统计的方法却得出不同的结论？原因就在于用以分析的关联词不同，即统计测度的切入点不同，当然也有统计方法上的差异，但前者是根本。至少存在几个统计测度上的问题：提取单一维度的关联词还是多维度的关联词？提取什么类型的关联词(例如：关联词是名词、形容词还是动词；是花卉、树木、饮食、医药还是诗词)？这些关联词可以综合为什么样的指标？等等。由此可见，原始统计测度代表着数据分析的方向。

相比《红楼梦》，大数据分析要复杂得多、困难得多。所以，数据科学除了需要数学、统计学、计算机科学与技术、人工智能等学科的交叉融合外，还需要与行为科学、语言学、社会学、经济学等学科相结合，以便能很好地解决作为数据分析之前提的统计测度问题。

第三，数据科学将进一步拓展统计测度的边界，并提出更高的要求。伴随着人类认识世界的范围的不断拓展，统计测度的范围也不断扩大，从自然现象统计测度到人口现象、经济现象统计测度，再到社会现象、环境现象、政治现象等统计测度，几乎已经渗透到了所有可以想象到的领域。相应地，统计数据分析也从少量数据的分析进入到了大数据分析。大数据的复杂性、不确定性和涌现性(王元卓等，2013)[14]，意味着统计测度的内容大大增加，原来一些不能测度的数据被纳入到了统计测度的范围，按照邱东教授的说法就是统计测度的边界大大扩展了。统计测度边界的扩大，必须以统计测度能力的提升为前提，即要求统计学借助现代信息技术进一步提升处理和分析数据的能力———对大数据“化繁为简”、“变厚为薄”的能力，这就必须以科学准确的大数据统计测度为前提，既改变统计思维，又创新统计分析方法，其中就包括统计测度思维、统计测度方法与统计测度标准。面对大量繁杂的数据，如果没有更好的统计测度思路与方法，包括个体标志定义方法、最小数据细胞分组与聚类方法、关联词含义的时间影响计量方法、定性测度指标筛选方法、再测度路径与方法、大数据统计测度评价标准等，那么统计学在数据科学发展过程中就难以发挥应有的作用，数据科学也将裹足不前。这就是统计学迈向数据科学的重要挑战之一。

综上所述，统计测度的基础性问题从统计学延伸到了数据科学，是两者的共同基础，并且对于数据科学而言显得更为重要。大数据的复杂性、不确定性和涌现性导致了统计测度的难度猛增，亟需建立面向大数据分析的统计测度理论与方法。要通过研究大数据的复杂性、不确定性和涌现性特征的基本因素，以及这些因素之间的内在联系、外在指标和测度方法，进而研究基于先进计算技术的大数据度量模型，构建寻找面向计算的数据内核或者数据边界的基本方法。总之，建立有效易行的数据表示方法，即科学的统计测度方法，是数据科学必须解决的基础问题之一。

四、创新与完善大数据统计测度方法

如前所述，统计学研究对象已经从结构化数据延伸到了包括非结构化数据在内的一切数据，统计测度边界得到了大大的扩展。按照邱东教授[7]曾经引用过的海德格尔的话：“界限并不表示某一事物的发展到此为止，而是像希腊人所认知的那样，界限是某种事物开始展现的地方”，预示着统计学在数据科学发展阶段的新起点已经展现在我们面前。新的统计测度边界催生统计测度方法的创新，统计测度方法的创新促进统计测度边界的拓展，两者相辅相成，共同推动统计学与数据科学的发展。为此，我们要系统梳理统计测度方法的发展历程，面对大数据提出的新挑战，大胆探索统计测度的新思路、新理论和新方法，为数据科学奠定坚实的统计学基础。为此提出如下几点建议：

首先，要紧密结合现象的本质去探求更科学的统计测度方法。本质决定一切，既然统计测度的目的是获得客观反映现象本质的数据，那么深入到现象本质、认识和掌握现象的本质，是科学统计测度的关键，也是探求新的统计方法的出发点。换句话说，科学的统计测度方法能够体现出数据的真正意义。例如，要探求社交网络数据的统计分析和测度方法，就必须了解社交网络的产生背景、构成要素、表现形式与基本特征，既要研究它的共性问题，又要研究它的个性问题与差异性，同时还要研究它的变化趋势。只有这样，才能掌握社交网络数据的构成要件或元素，才能建立起科学的、能有效体现社交网络数据意义的统计测度方法。再如，要分析研究电子商务数据，也必须先弄清楚什么是电子商务，尤其是弄清楚它与传统的商业模式有什么不同(包括物流、资金流与信息流)、有哪些新生事物(包括时空特征、法律监管)等等，否则统计测度无从下手或者抓不住要害。同时，作为一个新的研究领域，数据科学的理论基础将与计算机科学、统计学、人工智能、数学、社会科学等有关，离不开对相关学科领域知识与研究方法的借鉴，因此对相关领域的知识与研究方法的学习十分重要。否则，就会严重扭曲统计测度方法，胡乱设置测度标志，这需要引起高度关注。

其次，要紧密结合大数据的特点去创新统计测度方法。大数据的特点是复杂性、不确定性和涌现性并存，构成了多维的数据空间，里面蕴藏着丰富的信息资源，这是传统的统计数据不可比拟的。那么该从何处进入这样的数据空间？怎么进去？又怎么出来？这归根结底还是统计测度方法问题。因此，在开展大数据分析之前，首先要研究大数据的基础性问题，包括大数据的内在机理(包括大数据的演化与传播机制、生命周期)，数据科学与社会学、经济学、行为科学等之间的互动机制，以及大数据的结构与效能的规律性等等，为创新统计测度方法提供导向。本文认为，再复杂的数据也有共性，再不确定的数据也有规律，再涌现的数据也有轨迹。网络大数据背后的网络平均路径长度、度分布、聚集系数、核数、介数等具有共性的特征与参数，是开展复杂网络数据分析的基础(李国杰、程学旗，2012)[15]；大数据在时空维度上的分布形式、内在结构、动态变化和相关联的规律，是找到大数据分析切入口、进而简化大数据表征的前提；大数据的涌现性轨迹(包括模式涌现性、行为涌现性和智慧涌现性)，是研究更多的社会网络模型和理解网络瓦解失效原因，理解人们网络行为涌现特征(例如人们发邮件数量的时间分布特征)，以及探求大量自发个体语义融合连接形成有特定意义的通用语义之过程的路径(靳小龙等，2013)[16]。也就是说，这些共性、规律和轨迹就是统计测度的主要依据，也是重点内容。发展和创新能够准确发现大数据的共性、规律和轨迹的定量方法，其实就是发展和创新大数据统计测度方法。

第三，要紧密结合现代信息技术以完善统计测度方法。复杂、多变和不断涌现的大数据，不仅需要借助现代信息技术(包括硬件与软件)来解决极其复杂的分析计算问题，也需要利用现代信息技术来解决其繁杂多样的统计测度问题。对于大数据，不论是原始统计测度还是再测度，其复杂性或难度都不是传统的结构化数据所能相提并论的，哪怕是基本的关联词计数、分类与汇总，其工作量之大也超乎想象，不借用现代信息技术几乎是不可能完成的。而事实上，有些统计测度的内容与方法本身也是以数据处理能力的提升为前提的。可以说，脱离现代信息技术，人们难以承受大数据的统计测度与分析任务；要把统计测度思想变为可实现的统计测度方法，必须借助现代信息技术。为此，要充分利用各种信息技术和手段，把统计测度与数据清洗相结合、与数据分析模型相结合、与计算方法相结合，努力建立融自动搜索统计测度、动态演化统计测度和自主优选统计测度为一体的大数据统计测度方法体系。

精品推荐

测算方法论文