时间:2023-07-05 16:21:50
导语:在统计分析的撰写旅程中,学习并吸收他人佳作的精髓是一条宝贵的路径,好期刊汇集了九篇优秀范文,愿这些内容能够启发您的创作灵感,引领您探索更多的创作可能。
统计分析和计算机、互联网的相互结合给我们的生活生产带来了很大的便利,统计学通常是 以足够大量的社会情形做统计研究的,计算机统计分析的飞快发展是非常符合社会发展趋势 的,为了更便利更准确的处理各类数据,人们一直在对其进行深层次的探究,并且将这项技 术方法很好的运用到了科学、社会、医学等各个行业,现在人们可以利用计算机统计分析技 术快速的对所需数据进行处理得出结果,是人类科学历史上的一大飞跃,其发展脚步不容阻挡。
1 计算机与统计分析现代化
1.1 计算机与统计学现代化
统计学主要是通过数据搜集、整理工作将信息归纳分类,给社会经济等问题提供解决方案的 数理依据和基础,统计分析在社会经济问题研究中可以起到很大的作用,在社会经济飞快发 展的过程中,各行各业对信息的需求量越来越大,对各类数据问题处理的渴求度也不断上升, 互联网更是将信息网络化,这些的实现都需要统计学的介入而且在其中发挥重要作用,但是 现代社会信息数据的繁琐量大都不是传统统计学能够做得到的,这时计算机和统计学的有机 结合成就了信息网络化的大数据时代。统计学现代化的实现必须要依靠计算机这一现代化计 算工具的协助,现如今计算机统计已经被广泛普及和利用,与时展进步的趋势相吻合。
1.2 计算机与数据分析处理
传统的人工处理分析数据早已不能满足社会发展的需求,通过其与计算机的相互结合,很大 程度上节省了分析工作的时间精力,同时降低了数据分析处理过程中的错误几率。不仅如此, 可以进行多样化、标准化的数据分析,更加人性化;伴随人类社会的发展,人们对数据结果 的要求愈加严格,这无形之中促进了计算机数据分析技术的进步,推进了数据分析技术普及 各行各业的发展历程。
2 计算机与统计分析
2.1 计算机统计分析的一般方法
很多的数据分析流程软件在国际社会上是相互通用的,SPSS,SAS 等就是比较典型的统计分 析软件,这些软件已经慢慢地在我们国家的经济、教育、医疗等行业之间普及,不同的统计 分析软件表面上有些不同,但本质的分析处理方法不尽相同,步骤如下:
(1)录入数据信息 ;
(3)分析处理计算;
(4)得出结果并保存。
要进行计算机统计分 析首先要进行信息库、数据库的建立,建立之前先进行数据分类以便信息录入,使其进入数 据库中,有利于分析和解决,录入工作人员可以通过一系列计算机的功能应用将数据整理并 分类,计算机分析处理的计算是统计分析的关键所在,统计分析得出的结果可由图像或文字 表达出来,举个例子:图形分析水平较高的软件有 SPSS 等。计算机统计分析的最终目的是 为了得到正确的剖析结果和分析解释,这是重点同时也是难点,有待我们去创新提高。
2.2 计算机在统计分析中的重要作用
新形势下,社会生产经济的发展异常迅速,大数据的时代已经到来,信息量的急增,内容复 杂程度的增加传统的统计分析效率早已满足不了社会发展需求,在这场计算机和统计分析的 结合中,人们的生产生活发生了翻天覆地的变化,计算机起到了至关重要的作用。第一,计算机取代了传统的统计分析员,符合社会生产快速发展的需要,在数据量庞大、信息极度复 杂的情况下,计算机的超强计算能力真是如鱼得水,协助统计分析促进了人类社会的进步。 打个比方,投资者想要进行理财投资,想要挣钱的几率大一些,这时他就完全可以借助计算 机进行统计分析,能够很快很准确的得出结果,很大程度的提高了理财挣钱的几率。
2.3 数据统计分析中计算机的应用
计算机被运用到数据统计分析当中去主要是因为其强大的计算能力,人们只需要告诉计算机 要统计什么信息或者什么数据,需要哪个方面的分析结果,需要怎样的数据处理结果,这些 都是简单易于操作的问题,而最难的计算部分则由计算机这个“超强大脑”来解决,这不仅 节约了大量时间,还能减少错误的出现。我国的计算机技术在国际上不是很先进,我国自主 研发的一些计算机统计分析软件规模小、漏洞多,还要继续努力研发编程出可以与西方发达 国家相媲美的统计分析流程软件;另外还得加强操作人员的实际操作能力,选择适合自己的 统计分析软件进行数据分析处理,这是由于每个人对不同软件的操作实践程度不同造成的, 比如:EXCEL 和 SAS 软件的不同,也就有不同的操作员利用它来做同一件事,计算机的统计 分析。
3 如何利用计算机做好统计分析
做好计算机的统计分析工作属实不容易,首先,学习统计、分析原理知识,加强对分析处理 原理理解,将基本分析流程掌握透彻,注重各个分析处理过程中的细节部分;其次,软件的 选择也很重要,软件的理解掌握程度因人而论,在软件选择使用过程中,可以从入门到深入, 逐步利用计算机做好统计分析。
4 结语
在未来的日子里,计算机统计分析会更加深入的渗透到我们的生产生活中来,计算机和统计 分析是密不可分的;另外,我们国家的软件开发水平还达不到国际尖端水平,规模性、完整 性和规范性都还有很大的提升空间,让我们一起为我国的计算机统计分析事业努力钻研,创新进步。
参考文献
[1]杨坚白.统计分析的意义和特点[J].统计工作通讯,1956(10).
[2]杜慎仲.统计分析中存在的问题及对策浅议[J].发展研究,2002(03).
关键词:城镇居民;消费特征;聚类分析
一、问题的提出及分析
近年来,我国经济高速发展,国民经济快速发展的同时,人民的收入水平也得到了进一步的提升。居民可支配收入的增加使得我国消费水平也进一步增加。城镇居民人均收入增加的同时,消费结构也在不断地发生变化。及时掌握居民消费结构的变化情况及变化趋势,有利于及时地合理调整产业结构。这样,便可使得生产过程优化,合理地调配社会资源。本文采用SPSS聚类分析的方法,对城镇居民消费地域差异统计分析,分析考察我国各地区城镇居民的收入和消费结构是否存在差异。
二、基本假设
假设国家统计局公布的调查数据能基本反映整个中国城镇居民消费结构的平均水平。
三、模型的建立与求解
(一)2002年—2011年消费数据整理
表1、表2是2002-2011年十年间中国城镇居民消费关键数据,资料来源于[1]。
(二)中国城镇居民消费数据分析
首先,通过表1可以看到目前城镇经济与城镇居民消费水平是继续保持稳定增长,2011年消费支出达到了15160.8,跟2010年城镇居民消费相比增加了1689.4。边际消费倾向=消费的增加额/收入的增加额=1689.4/2700.3=0.626,这表明人民消费信心增强,但是城镇居民还是偏向于储蓄的倾向,储蓄比例达到了0.374(因为消费比例和储蓄比例和等于1)。另外,从表1可以清楚地看到,我国城镇各类消费是持续的增长。近十年来,我国城镇居民消费一直在迅速增长,我国城镇居民人均可支配收入由2002年的7703元增加到2011年的21809.7元,翻了=÷8133.277037.21809倍(四舍五入保留到小数点后四位,下文相同),可支配收入增长与消费支出呈现了相对的一致性。由表1可看到食品消费这十年增长了5506.3/2272=2.424倍,由表2可看到我国食品占有的消费比例越来越少,但还是消费的主体。其中肉类食品的消费由2002年的413.54达到1105.93,增长了一倍多,这表明随着生活的改善,人民消费逐渐倾向高蛋白等有营养的食品,人民在蛋类,水产品,奶制品等消费也比较均衡,各项也均相对消费增长了一倍,鲜菜在2011年各类菜类购买中数量是最多的达到114.56千克,表明城镇居民还是喜欢绿色食品。恩格尔系数占用的可支配比较大(食品消费比例即是恩格尔系数)。恩格尔系数总体呈下降趋势,2002年我国城镇居民恩格尔系数为0.377,在2002年至2011年十年间,恩格尔系数最低达0.351,2011年我国城镇居民恩格尔系数为0.363,另外通过观察表1和表2得到我国城镇居民近十年来恩格尔系数在波动中下降,也就是说恩格尔系数总体呈现下降趋势。表2中食品消费比例也由1990年的54.25下降到2011年36.32,我国已经从一个人民徘徊在温饱线水平的国家,达到了发展中的小康社会。但是恩格尔系数在波动中下降与我国人民讲究吃、注重食物质量消费也有不同程度的联系。进一步还可以了解到,我国城镇消费和农村消费差距也越来越小。从表1中看到我国城镇交通通讯消费在这十年增长了2149.6/626=3.4339,表2中,交通费用由1.2增长到14.18,可以看出是增长最快的。这表面了随着我国经济的增长,城镇出行已经逐渐出现了以车代步,居民交通更加便利。随着科技的发展,交通费用成本的增加也不是很显著。由表2可以看到我国城镇居民在衣着、居住、文教娱乐消费比例还是没有多大变化,说明了人民对这几项偏好是比较稳定的。表2中医疗保健消费比例持续增长,可以看到人民注重物质生活改善的同时也越来越注重身体健康,这也是未来城镇居民消费增长的重要点。居民消费在衣着、家庭设备、交通、通讯、居住消费性支出在近十年来涨了三倍左右,在食品、医疗保健、教育文娱消费性支出涨了两倍左右。就这几项全国城镇居民消费范围来说,各种城镇居民人均消费支出均在增加,但是每项消费支出的增幅有所不同,居住的消费一直在国家宏观调控稳定中发展。城镇居民人均住房建筑面积32.7平方米,也是增长比较快,基本上已经达到了平均一家一居室。而通讯业例如手机每百人达到205.25,每一百个人含有电脑81.88台,已经接近一人一台电脑了,消费比例在家庭设备及应用由表2可知是在下降的,消费支出由10.14下降到6.75,说明随着科技的发展,尽管城镇居民在各种家庭设备、电子产品购买实际数额是在增加,但是科技产品行业或者说这种劳动密集型产品消费比例也越来越低。
(三)城镇居民消费地域差异统计分析
本文采用spss19软件对北京、天津、河北、山西、内蒙、辽宁、吉林、黑龙江、上海、江苏、浙江、安徽、福建、江西、山西、河南、湖北、湖南、广东、广西、海南、重庆、四川、贵州、云南、,陕西、甘肃、青海、宁夏、新疆31个省,2011,2010,2009年城镇居民平均每人消费状况进行聚类分析。通过比较K-均值聚类法(快速聚类法)对我国32个省直辖市进行聚类分析,输出分层了3层。比较合理的聚类方法是将所有样本分成3类,第2类包括北京、上海,广东、浙江、广东,第2类的最终中心距离比第三类多4000-5000多左右,第2类的各地区城镇居民家庭平均每人全年消费性支出最高。第3类是天津、内蒙古、辽宁、江苏、福建、山西、重庆,比第一类基本上多300多左右。属于中等消费省市区域,剩下的其他样本则属于第1类。很显然,我国城镇消费是不均匀的,我国城镇居民在东部沿海城市消费比较高,这是因为在东部沿海等省市经济发展比较迅速,可支配收入比较高的原因。而中部地区却因为经济发展、地理位置原因和消费习惯,经济发展赶不上东部沿海。归为第三类的城镇居民消费省直辖市有20个,占据了绝大多数,其中绝大多数是西部城市。
综上所述,我国消费水平还处于发展阶段,东部沿海居民消费比较高,而中西部比较落后,更需要提高中西部居民的消费水平。从以上表中我们也可以看到东西部收入,消费差距依然很大,国家应该加大对西部地区的扶持力度,缩小东西部差距,促进全国城镇居民消费均衡。
作者:杨建奇 房树文 黄传名 单位:湖南科技学院理学院
参考文献:
[1]数据来源网站:中国人民共和国国家统计局/.[EB/OL].
[2]张月,曲坤,林美艳.因子分析在我国城镇居民消费结构研究中的应用[J].大连交通大学学报,2006(1).
[3]胡丽平,何春花.河南省城镇居民消费结构变动的实证分析[J].河南农业大学学报,2011(3).
(一)统计分析的概述
统计分析是指运用统计方法及与分析对象有关的知识,从定量与定性的结合上进行的研究活动。它是继统计设计、统计调查、统计整理之后的一项十分重要的工作,是在前几个阶段工作的基础上通过分析从而达到对研究对象更为深刻的认识。它又是在一定的选题下,集分析方案的设计、资料的搜集和整理而展开的研究活动。系统、完善的资料是统计分析的必要条件。
(二)统计分析的特点
运用统计方法、定量与定性的结合是统计分析的重要特点。随着统计方法的普及,不仅统计工作者可以进行统计分析,各行各业的工作者都可以运用统计方法进行统计分析。只将统计工作者参与的分析活动称为统计分析的说法严格说来是不正确的。提供高质量、准确而又及时的统计数据和高层次、有一定深度、广度的统计分析报告是统计分析的产品。从一定意义上讲,提供高水平的统计分析报告是统计数据经过深加工的最终产品。
1.运用统计方法:统计方法是以总体现象的数量关系为对象的一类特殊科学研究方法的总称,从运用的角度可分为经验方法和数学方法。经验方法是指人们长期的统计实践经验相关的方法。在统计分析中常用的数量比较法、分组分析法、指数及因素分析法等就属于这一类。对于这一类方法如能正确运用,可以提高统计分析的科学性。
2.定量与定性的结合:统计分析面对的不是抽象的数字,而是在定性分析的前提下。通过其数量表现对研究对象进行认识。因此,熟悉和掌握与研究对象有关的知识是十分必要的。
二、统计分析在企业中的运用
统计分析在一个企业的运转中发挥着举足轻重的作用。从统计认识的全过程来看,通过统计设计、调查和初步整理所取得的统计资料,可以对客观现象总体的数量特点取得一定的认识。但是这些认识却只是初步的、表面的,只有对这些资料进行由表及里的分析和研究,才能把握事物的本质特点、内在联系和发展变化规律,使统计认识得到进一步的深化。由于统计分析具有深化认识的作用,使得统计分析在企业当中得到广泛的应用。
统计具有数量性的特点,统计分析所起的作用,主要是通过定量的分析来实现的。统计分析在人们的认识过程中主要有三个方面的作用:一是对客观事物量化,包括反映客观事物规律的数量表现;二是根据量变程度确认事物的质,即确定区别事物质量的数量界限;三是揭示新的规律,即通过分析数量关系,发现尚未被认识的事物的规律。统计分析工作是一个从感性到理性的认识客观世界的过程。在企业正确处理好统计分析工作,可以从整体上更为全面地看清现状,可以更好地促进企业的发展和发挥统计分析工作的作用和意义。就社会经济领域而言,统计分析还是发挥统计整体功能,提高统计工作地位的重要手段。随着我国改革开放的实施,社会经济领域发生了深刻的变化,各级领导部门和决策者仅凭个人能力和经验已经很难把握瞬息万变的局面,更难以正确做出科学的决策。在这种情况下,统计分析的优势随之显现。它可以把数据、情况、问题、建议等融为一体,既有定量分析,又有定性分析。比一般统计数据更集中、更系统、更清楚地反映客观实际,又便于阅读、理解和利用。因而是发挥统计的信息、咨询、监督功能的主要手段。与此同时,也提高了统计工作的社会地位。
三、统计分析在企业发展中应用广泛,主要体现在三个方面
第一,统计分析在企业预测中的应用。在统计预测中,一般强调静态分析预测和动态分析预测相结合,以静态分析预测为主。首先,企业应根据自身特点,重点进行年度、季度统计预测分析,确保企业目标管理和考核的有效性。其次,要根据企业的计划目标和历史销售数据确定各项数据指标,找出经济运行波动的共性和差异性。再次,要根据企业的总体规划和行业的特殊性,综合运用一定的预测模型来提高分析的科学性,公司的市场份额取决于该公司的产品、服务、价格、沟通等与竞争者的关系。如其他因素相同,则公司的市场份额取决于它的市场费用在规模和效益上与竞争者的关系。
第二,统计分析在企业决策中的应用。随着企业信息化建设的推进,企业受外部环境的影响逐步加深,这就要求企业及时对相关信息进行处理和分析。一是对市场需求和供给能力的分析。主要包括居民的购买力、商品的潜在和实际市场需求量、品牌成熟度、订单满足率、消费偏好等。通过分析,可以判断企业的赢利空间、供需缺口等,为领导层确定商品销售规模、制定阶段性营销策略等提供依据。二是对社会经济环境的分析和影响。主要包括国内、国际的宏观环境对我国行业发展的影响和对地方法规、民风民俗对企业的发展的影响。三是对企业竞争力的分析。通过分析本行业其他企业的经营情况,在对比中认识自身发展的差距和潜力,从而为制定正确的发展战略提供参考。
SPSS17.0软件来分析血清生化测试的结果,连续变量两组比较时,采用t检验;连续变量多组比较时则使用单因子变异数分析,事后比较则使用Scheffe法,并评估其95%置信区间.每一次资料的选取都要将各个性别特征及年龄特征显现出来,参考值的数据则是反映在评估第2.5至第97.5百分位(2.5th~97.5thpercentiles)的非参数范围内,结果若P<0.05则认定为具有统计学上的意义.
2结果
2.1不同年龄段人群的生化指标检测结果表1是不同年龄段人群血清分析的结果,成年人相比儿童有较高的生化分析值(尿素氮/肌酐比值除外),且具有统计学意义(P<0.01).3~6岁儿童与≥20岁成年人相比χ2=20.43,P<0.01;9~12岁儿童与≥20岁成年人相比χ2=21.62,P<0.01;13~15岁儿童与≥20岁成年人相比χ2=23.16,P<0.01.
2.2不同性别儿童的生化指标检测结果表2是根据性别特征分析血糖、丙氨酸转氨酶、血清肌酐、血尿素氮及B/C比值(尿素氮与肌酐浓度的比值)与参考值(第2.5至第97.5百分位),依多元回归分析法取得的生化分析值数据,男性要比女性高,且具有统计学意义(χ2=22.17,P<0.01).表2是依性别特性以多元回归分析法为基础,在不同性别组群的血糖、丙氨酸转氨酶、血尿素氮及血清肌酐的95%信赖区间值(95%CIs)与参考值(第2.5至第97.5百分位)的结果显示:丙氨酸转氨酶值是1~179IU/L,最大值是≥20岁的女性,而最小值是3~6岁的女童;血糖值是介于52~183mg/dL之间,最高值是≥20岁的男性,最低值是9~12岁的女孩;血尿素氮值从5~34mg/dL,最大值是≥20岁的女性,而最小值是3~6岁的女童;血清肌酐值是0.2~2.2mg/dL,最高值是≥20岁的女性,最低值是3~6岁的男童;B/C比值是4.6~80.0,最高是3~6岁的男生,最低是≥20岁的女性.血糖及肌酐浓度随着年龄的增加而上升,相反地,B/C比值是随着年龄的增加而递减(如表1).所谓不正常范围是测出来的结果落在均值与标准偏差计算范围之外,通常是将统计所得结果的均值正负一个标准偏差(meanSD)或正负一个标准误差(meanSE),也可以用第2.5至第97.5百分位(2.5%~97.5%)的非参数评估法显示.2.3儿童整体生化指标值统计分析表3结果显示从第2.5至第97.5百分位(2.5%~97.5%)的各种生化指标的范围:丙氨酸转氨酶值为8~38IU/L、血糖值为60~99mg/dL、血尿素氮值8.7~18.0mg/dL、血清肌酐值是0.4~1.1mg/dL、B/C比值是10~34.
3讨论
本研究中幼儿园儿童的血糖浓度比一般参考值(表3)要低10.4%,而且所有女性的血糖浓度比男性还要稍为低一点(表2),其他的研究者也有类似的报告[1-3].在表1中可看出血糖浓度数值是随着年龄的增加而上升的,9岁至15岁年龄组的血糖浓度已经与他们的老师相仿,Jagarinecetal.[3]的报告也指出由儿童到青少年时期血糖浓度已经跟他们的成人期相类似.儿童和青少年的丙氨酸转氨酶值(ALT)比成年人低,之后随着年龄的增加而上升,而且男性高过女性,其他研究者也有相同的报告,Jagarinecetal.[3]及Mohamadnejadetal.[4]的报告显示丙氨酸转氨酶值在青少年期即已跟成年人相似.肌酐浓度在14岁之后即朝着成年人值稳定地增加,而且与性别有关[3].在本研究中,肌酐浓度在青少年时期(13~15岁年龄组)即与他们的老师相似.在表2中男性的肌酐值高过女性,而且具统计学上的差异,许多研究者确信在性成熟的年龄期会迅速升至成年人值,最近的研究显示从食物中摄取蛋白质会影响肌酐的产生,进而影响个人块状肌肉的形成.Hristovaetal.[5]Jonesetal.[6]也报告男性的各年龄层的肌酐值都比女性高,可能是男性的肌肉比较强壮的原因.血中尿素氮值儿童要比成年人低,男性高于女性且发现具统计学上的意义,Jagarinecetal.[3]也有类似的报告.Hristovaetal.[5]的报告显示:若是正常的成人正常的进食,多数人其尿素氮/肌酐比值的参考值是10~20,一般都在12~16之间.肌酐值正常而有高的尿素氮/肌酐比值,是典型的高蛋白质摄取者.严重的肝病患者其蛋白质吸收缺乏,则会导致低的尿素氮/肌酐比值,不过这种病例非常罕见.在本研究中,3~6岁年龄群的尿素氮/肌酐比值要比参考值高出65%,这可能跟儿童时期正在成长发育而需要摄取大量的蛋白质有关,我们期待将来有更多的研究去探测这种现象的原因.
肥胖不仅会影响成人的健康,也会带给青少年威胁.陈志成等[7]的研究表明,身体质量指数(BMI)超过30的肥胖青少年,肝功能指数异常比率是其他人的40倍.如果这些青少年是男性且为B型肝炎病毒携带者,异常比率甚至高出百倍以上,若不及早减肥,未来很有可能走上慢性肝炎、肝硬化甚至肝癌,该研究以3610名高一学生的健康检查资料,分析体重与肝功能指数之间的关系,赫然发现BMI值超过25就会引发肝功能指数的ALT检测值异常,一旦BMI值超过30,异常值更上升到令人担心的地步.当前家庭独生子女多、单亲及隔代教养等因素,让不少小孩子备受宠爱,想吃什么,就能吃什么,长期吃脂肪含量过高的食品,必定会导致肥胖.因为BMI值过高的儿童会影响ALT以及血糖的检测值,所以本研究中必须将太肥胖的学龄儿童剔除于统计数值之外.根据Jaffe反应动力学法显示:血浆置24h后肌酐会增加100%,血清中肌酐则增加60%,这种影响可能造成所谓的伪肌酐值(False-Cr)[8],有些戏剧性的增加不能用单纯的血液浓缩来解释,因为有许多其他的非代谢性自我分解(如:血尿素氮)仅仅上升2%至6%[9].血糖浓度在第一个24h时会迅速下降,之后到56h则缓慢下降,但在血浆中的下降更显著,血浆或血清中的葡萄糖都是以化学当量法经由醣分解产生乳酸盐[9],在本研究中,血糖的浓度比参考值要低5%至15%,可能是血清检体送到实验室或与全血分离时延缓所致,但在流行病学的研究上,血液检体的采集需要大量样本及到地域分布较广的地区进行,因此血液的分离及输送难免会延误[10].以前的研究显示,中国儿童的生化参考值比克罗地亚的小孩要高[3],相反地,中国儿童的生化分析值比澳大利亚及美国的小孩要低[11],我们的生化分析参考值则比较相似于西班牙儿童的生化分析值[1],会使人联想到是种族的因素,或许也有以下两种的可能性:不同的生活习性或不同的地理位置所致.
4结论
关键词:油轮管理TMSA统计分析
1 TMSA形成
TMSA(Tanker Management and Self Assessment)即油轮管理与安全评估,是进入国际主要石油公司业务的必迈门槛,受到越来越多的油运公司的广泛关注和采纳。早在上世纪70年代,石油巨鳄便聚集一堂,成立了石油公司国际海事论坛,简称OCIMF(Oll Company Inte rnationalMarine Forum),该组织经过了几十年运作,OClMF已发展成为一个以国际石油巨头为主,由59个成员组成的国际行业组织。1998年,ISM规则开始强制实施。由于各缔约国主管机关对ISM规则实施的具体要求不同,导致各航运公司及其船舶安全和环境保护水平参差不齐,给石油公司租赁船舶营运带来了很大风险。于是,在本世纪初,TMSA首先在个别大石油公司中采用,但随即被OClMF的其他会员认同,目前TMSA已在OCIMF组织内统一作为各大石油公司对油轮公司及其船舶检查标准。目前在行业内,大家普遍认同:TMSA是一种可以帮助船舶营运人测量并改进其管理体系的工具;它可使船舶营运人对照列出的关键绩效指标及行业最好做法评估其安全管理体系;它是对照行业最好做法解决问题最有效的方法,使营运人在诸如追求安全和环保卓越等一些关键领域中发现机遇并优化其自身的经营业绩;它使公司致力于通过持续地改进其过程和程序将行业的最好做法转化到其船队管理中来的一个准则。
2 TMSA基本要素与实施要求
TMSA目前是油轮管理行业基于lSM规则建立的行业管理标准,其目的是为油轮管理公司提供可以被衡量的初始基准和主要评估指数,为船舶管理者对管理体系的评估提供了一个标准的框架。TMSA主要由12项关键要素组成:管理、领导作用和责任;岸基人员招聘及管理;船员招聘及管理;可靠性与维修保养标准;航行安全;货物、压载及系泊作业;变更管理(即对制定、执行程序的变化进行管理,确保现有标准不降低);事故调查及其分析;安全管理;环保管理;应急准备及计划;测量、分析和改进。
每个要素分成A和B两个部分,管理标准分为四个等级,按照循序渐进的方式由最基本的一个等级提升至最高的四级,不断整改和完善,满分为4分,目前国际大石油公司对油轮管理公司比较认可和满意的TMSA分数是2.5分及其以上。
TMSA实施要求重视自我评估,讲求诚信。油轮公司在实施TMSA过程中,要求油轮公司定期按照此导则逐项对照公司的综合管理体系进行自我评估定级后,明确其管理水平及发展趋势,找出差距,制定完善措施,以实现持续改进,并向OCIMF提交评估符合报告。
3 TMSA的特点
TMSA的特点体现在:TMSA是油轮管理者根据固有标准衡量自己表现的准则;TMSA鼓励管理者根据关键要素找出最优管理方法;TMSA是根据lSM规则制定,是ISM的补充但并不代替ISM;油轮船东要接受石油公司检查,而绝大多数检查官是具有OClMF认可资质的独立第三方,具有社会权威性;TMSA要求异常严格,要求非常具体,随意性和变通的余地很少,它非常注重统计分析这一工具,非常重视风险评估和管理的变更、等级制相关的规定等,并要求船东讲求诚信。
1)要求的高标准性。TMSA作为当前海事界最为“苛刻”的规则之一,包含安全、质量、健康和环保管理等内容,其要求已超越lSM、ISO9001、IS014001标准。
2)要素标准规定的具体性。ISM、IS09001、IS014001都是从整个航运环境来定义的,具有原则性和概括性的特点,而TMSA是专门针对油轮公司及其管理而言的,某些要素的要求都非常具体,随意性和变通的余地小,实施评价的针对性强。
3)注重对数据的统计分析。TMSA非常注重利用统计分析这一工具,以便发现共性问题及其发展趋势,而其中要求的一些管理措施必须首先统计分析,然后根据分析结果再制定管理措施,如要求改进船舶航行弱点,就必须先进行弱点趋势的统计分析。
4)重视风险评估。针对油轮运输存在的高风险性,TMSA要素9专门对风险评估做了规定,要求船岸定期及在开展涉及风险的项目前都必须进行风险评估,制定措施,将风险项目的风险降低到可接受的程度。
5)变更的管理。TMSA充分考虑了因设备、人员、程序等的变更可能导致的事故风险,为此要素7要求对所有的临时变更和持久变更必须进行风险评估,明确进行变更所需的权限,并制定预防措施。
6)重视自评与油公司的认可。TMSA要求油轮公司定期(一般为每季度一次)组织对管理状况进行自我评估,明确其管理水平及发展趋势,依据最佳指南找出差距,制定改善措施,实现持续改进。当自我评估达到一定的等级水平时可向OClMF提交油轮公司自我评估报告,申请相应的管理等级。
7)持续提高的管理等级制度。TMSA依据最佳指南将管理分为四个等级,油轮公司在实施TMSA2_初并不要求达到第四等级,而是从最基本的第一级标准为目标做起,逐步提高,持续改进,最终实现“零污染、零事故”的管理要求。
8)动态管理,追求卓越。TMSA对管理的要求并不是一成不变的,OClMF会根据行业管理的发展水平,定期对TMSA中的最佳指南及关键评估指标(KPl)进行完善,以实现通过不断的自我完善达到卓越管理的目标。
总体来说,TMSA的实施填补了国际安全管理规则(1SM)最低船舶管理要求和油轮管理工作特殊性之问的空缺,为油轮公司完善其体系,减少对环境、人员的危害,最终实现卓越管理,提供了一种方便而实用的评估准则。
4 TMSA实施对船舶管理要求
4.1对油轮公司高层管理者要求
通过公司高层强而有力的管理能够提高公司各阶层对安全和环保的理念,确保和增加油轮营运的安全性。
1)高层领导对公司安全职责清晰的自我认识、确保安全管理工作的明确实施、对公司安全环保管理理念的清晰了解、良好的船岸沟通能力以及对以往险情的经验教训的总结等有助于高层领导在对油轮管理团队的掌控,是领导和管理能力体现的重要方面。
2)自身条件较好的高层领导通过建立明确合理的安全目标,并对安全目标的实施落实过程进行考核和监控,能督促各阶层的安全工作和安全环保意识,进而促进油轮营运的安全。
3)高层领导在完成目标的制定后,还要建立促使各阶层认真落实的管理决策办法。通过建立各阶层安全书面文件流程,保证安全指令能够顺利执行。严格控制公司安全政策全面涵盖油轮安全营运的各个方面,做到不遗不漏,不放过任何安 全细节。建立畅通的政策下达通道,保证油轮能及时接到高层领导的安全指示。建立油轮管理的安全体系,并根据日常管理中的问题和新的实际情况,及时对公司安全管理体系进行更新和考察,保证公司营运始终处于最安全的领导模式下。
4.2对油轮公司岸基管理人员要求
通过招聘及管理岸基人员,形成符合资格、高水平的管理人员团队,保证合理的管理油轮船队。通过合理的程序选拔岸基管理人员,能够保障相关任务的正确实施,减少不应有的失误,增加油轮的安全性,减少因岸基管理人员的工作失误而造成的经济和人员损失。对岸基人员的管理包括:岸基人员的招聘、岸基人员的培训、岸基人员的考核、岸基人员流失控制四个方面。
1)在岸基人员招聘时,要严格把关,对申请人员进行资格审查,同时要有辨别申请人员资料真伪的程序。防止不合格的人员蒙混过关。还要对招聘的岸基人员进行严格体检,确保公司招录的新人能够胜任工作的需要。
2)对新招聘的岸基管理人员,要进行严格的上岗培训,在职培训,以确保他们能适任工作。同时要保证培训资料、课程、资源的充足,保证培训的有效性。对于主要的岸基管理人员,要经常组织他们参加行业讲座、会议、论坛等,并接受更新知识培训,以保证他们具备要求的技术、技能,工作中做出正确的决策,保障油轮运营安全。船上的四位高级船员对油轮生产实践认识深刻,对生产管理有直接的认识,要保证他们要有机会调任公司,一方面促进岸基管理制定出针对性的决策,另一方面提高高级船的积极性,增加油轮运输中的安全系数。
3)要建立健全岸基人员工作的考核制度,通过定期的工作考核,对考核过程发现的问题及时处理,减少安全隐患。对考核结果进行总结,对优秀的员工进行晋升和参加更高层次培训,从而促进岸基人员工作的积极性。
4)要严格控制岸基人员流失率,两年内的流失率不能超过30%,过大的人员流失会造成工作生疏,不能密切配合,做成失误过多,影响油轮的营运安全。
4.3对油作人员要求
通过对船员的选拔和管理,使油轮船员能够符合资格要求,专业技能过硬,对其职责和功能明确。能够准确合理地完成油轮的日常工作,在紧急情况下,能够做出正确判断,从而减少事故发生,降低事故的损失。按照规定的培训、考核制度,不断提高船员的技能,增加油作的安全性。并且严格控制公司船员队伍的流失率,减少因船员变更过大对油作安全的影响。
1)船员招录时要严格审核船员资历和证书,并严格进行上船前的体检工作。按照既定的船员招聘、筛选、提职程序对船员进行管理。
2)对船员进行充足的入职培训、高级船员的安全培训等,增加他们的工作技能和安全意识。
3)对船员的工作进行考核,对不合格的船员进行再培训或者解除合同,对优秀船员进行奖励,增加其工作积极性。并有合理的晋升程序,保证优秀船员能够做到更高的位置。
4)要控制船员团队的流失率,两年内不得大于20%,尽量保证船员团队的完整性。
4.4对油轮管理模式与理念的要求
在完成人员配置后,为保证管理的有效性,促进油轮的安全,必须建立各种规章制度,并保证规章制度的落实。这些规章制度包括对油轮的维修保养制度,航行安全、货油、压载水和系泊作业,管理因素的变更,事故调查及分析,应急预案及应急部署等六个主要方面。
1)油轮的维修保养制度。每艘油轮都要配备详细的维修计划书及缺陷报告系统。公司应定期检查维修保养计划书是否有效。除船上,公司应能监控船舶证书的有效性,机务总管应跟随所有维修保养,并上船以审核船上维修保养及缺陷报告的计划。公司政策应包括保持船舶备件库存及流水账等。
2)航行安全。安监室应按公司所制定的程序对船舶安全航行进行评估,并将安全航行程序纳入公司安全管理体系。确保海图的更新,英语认可的海图供应商签订合同并自动供应所需海图。确保所有航海仪器正常运作,公司应记录所有缺陷及修正行动。大副升船长前务必再次接收船舶模拟操控培训。
3)公司因对装卸货油及压载水作业的规范有书面的计划,每次作业均需获得船长的批准。船上应有资深高级船员(大副)负责货油装卸及压载水作业。要用公司的格式报告书并定期检查货油舱和压载舱,通常压载舱每六个月一次,货舱一年或坞修时检查一次并做好相关记录。大型油轮装载货油量大,靠泊时系泊程序严格。一般要求零航速抛深锚。公司要对系泊设备有书面的维修保养程序,有书面程序以确保所有的系泊设备和其作业方式符合OCIMF指引及有关规定。
4)管理因素的变更。但管理因素变更时,应建立一个有效的管理程序以减低风险;管理人员变更时,要进行必要的培训,保证变更后的工作正常执行。设备变更和接新船时要加快对新设备的熟悉。公司应使用正确方法评估变更管理因素所带来的影响,并每年都对管理因素变更造成影响进行检讨。
5)事故调查及分析。利用有效的事故调查报告及跟进措施,从中吸取教训,减少事故发生。当船队涉及安全事故,公司应有迅速的通报机制,并对事故进行调查分析,找出事故原因得出结论。对船/岸人员进行培训,增强其调查分析能力。
6)应急预案及应急部署。船岸各部门应有详细的应急预案,对人员进行详细分工。确保有足够的应急设备,并且严格按照规定进行应急演习,总结经验教训。
5 TMSA检查情况分析
5.1TMSA检查缺陷分布情况统计
某油轮船队近几年共有近百艘次船舶接受了石油公司检查,总通过率为90%以上,无缺陷通过率相当少。检查缺陷总计有500多条,缺陷的分布为TMSA第1要素1项,第2要素37项,第3要素19项,第4要素57项,第5要素113项,第6要素51项,第8要素71项,第9要素章53项,第10要素10项,第11要素74项,第12要素章30项;重复缺陷210项占缺陷总数的40.7%,高风险21项占缺陷总数的4.1%。
按船舶上管理部门分,甲板部的缺陷占总数的70%;轮机部的缺陷占总数的30%左右来看,应该注意到这与我国传统的船舶管理要求中重技术、轻管理有关,这是值得我国航运企业船舶高层管理者应该重视的问题。
5.2缺陷原因分析
1)航行管理占缺陷总数的11%,从近几年对比看,属于上升的,而目前石油公司很关注航行管理方面的缺陷,一旦查出即为高风险缺陷,需要引起我们重视。产生的重复缺陷主要集中在航海图书资料的有效改正,同时,航海日志和车钟记录簿的规范记载问题也逐渐增多。
2)安全管理缺陷占总数的21.9%,是缺陷高发项目,几年来变化不大,也真实反映我们的安全管理水平。主要的重复缺陷的项目有:船岸安全检查表填写不规范、封闭场所进入许可证没有按照体系要求进行实施、船舶的便携式气体探测仪校验问题依旧是重复次数较多的缺陷,船舶对配备标准不清楚,岸基地也没有定期跟踪船舶仪器的状况。
3)货物与压载系统占总数的13.8%,总的来说进步明显,公司在进一步规范货物操作的同时,还应注意货物质量安全。主要缺陷有专用压载舱的有效充惰问题,真空压力释放阀的维护和记录方面需要制定相应的管理措施,统一维护要求。MSDS不完整、货舱压力报警值的正确设定、P/V BREAKER的防火网等缺陷也多次重复出现。
4)机舱管理方面缺陷(VlQ第1 1章)占总数的14.3%,船舶的计划维护系统(PMS)没有船级社的批准在检查缺陷中出现了20次,但随着船队船舶管理系统(SMlS)在船使用的推进,这类问题会基本得到解决。但值得注意近年共有11艘次船舶被开出“经认可的无人机舱处于有人值班状态”这样的缺陷,因为检查官认为“无人机舱处于有人值守是船上代表机舱设备的运行存在安全隐患的一种表现”,这与我国航运企业至今还存在着“有人在总比无人在要好”的传统管理理念有关,这需要船舶管理者在管理理念上的转变。
1短时统计分析判决算法
1.1贝叶斯分类器设计对于一帧语音信号,还不存在一种能够完全准确的判别出是清音还是浊音的方法。面对研究对象的复杂性,不得不借助统计的方法。在语音信号中,清音帧、浊音帧不是孤立出现的,而是每当出现时,总是一段连续的清音或一段连续的浊音,且清音和浊音的过渡也是比较明显的。可以通过手工标注的方法把清音段和浊音段分离,分别获得清音帧和浊音帧的样本训练数据。为了对清音帧和浊音帧进行分类,使用贝叶斯方法建立清、浊音分类:作为清浊音的判定规则。当需要对语音信号中的某一帧进行清浊音判定时,首先采用统计模型中的训练数据分别计算该帧为清音或浊音时的概率,然后求其概率的比值T。若T叟1,则认为帧为清音帧;若T刍1,则认为帧为浊音帧。
1.2清浊音帧能量的概率密度估计清音帧能量和浊音帧能量具体服从什么分布并不明确,对它们概率密度的估计采用了两种函数逼近的方法。一种是伽马分布的密度函数:其中μ、σ分别为均值和方差。为了便于观测逼近效果,分别绘制了清、浊音分布直方图(图1),伽马分布对清、浊音的逼近效果图(图2)和高斯分布对清、浊音的逼近效果图(图3)。
1.3算法步骤(1)选取语音信号s(n)作为处理对象,进行波、分帧、加窗、预加重,获得预处理的信号sw(n),并用短时能量公式求出每一帧的短时能量。(2)统计训练样本中清音帧、浊音帧在总体中的比例,其值分别作为清音、浊音的先验概率P(u)、P(v)。(3)分别选择对清音、浊音帧能量的分布进行逼近的函数,分别得到相应的概率密度估计fu、fv。(4)任选取一未知帧语音信号,分别代入密度函数fu、fv,可分别求出其对应的类条件概率密度(fx/u)和(fx/v)。(5)在得到清音帧、浊音帧的先验概率P(u)、P(v)和未知帧在清、浊音下的条件概率密度密度(fx/u)、(fx/v)后,可用上面设计的贝叶斯分类器进行清/浊音帧的判别。
2实验结果
[关键词] 现货 期权 套期保值
一、引言
套期保值是投资者利用衍生金融工具规避现货价格风险的一种有效策略,人们多数使用期货来保值,然而,使用期权也是一种有效办法。本文对期权套期保值进行一些统计分析,分别建立风险最小的模型和收益最大且风险最小的模型,通过求解模型来确定期权合约的数量,并且导出一些统计指标对所得到保值策略进行评价。
二、期权套期保值的收益与风险
设投资者买入欧式期权对现货进行套期保值,将来交易现货的时间是期权到期的时间,期权的期限是t。将来交易现货分买入和卖出两种情况,考虑买入看跌期对将来卖出现货保值,买入看涨期对将来买入现货保值。设现在现货的价格为s0,到时刻t时,现货的价格为s。如果投资者要保值的现货量为,而需要交易的期权标的物数量为,令,则称k为期权套期比。再设期权的敲定价格为X,每单位标的物所需要的期费用为,在时刻时,看跌期权的收益为,看涨期权的收益为,所以对卖出单位现货保值的收益为:,对买入单位现货保值的收益为:。
它们都是随机变量,记,和C的期望分别为,,,则这两种保值策略的期望收益分别是:
(1)
(2)
记,和C的方差分别为,,;与,与C的协方差和相关系数分别为,;。如果用方差表示套期保值的风险,则这两种保值策略的风险分别是:
(3)
(4)
三、风险最小的期权套期保值模型
对卖出和买入单位现货保值的最小风险模型分别是:,。分别令和关于k的导数等于0,再求解两个关于k的方程,就得到模型和模型的解分别是:
用这两个套期比,就可以确定期权合约数,从而可以制定最小风险的套期保值策略。我们还要对所得的保值策略进行评价,为此引入以下的评价指标:
1.风险最小的套期保值策略的预期收益
把和分别代入(1)式和(2)式,得到两种保值策略的预期收益分别是:
(5)
(6)
2.风险最小的套期保值策略的预期风险
把和分别代入(4)式和(5)式,得到两种保值策略的预期风险分别是:
(7)
(8)
3.风险最小的套期保值策略的预期效率
我们也可以用相对数进行评价,即用保值风险与不保值风险之比来评价套期保值风险,这个比值称为套期保值效率,对卖出现货保值和对买入现货保值的效率分别是:
(9)
(10)
四、收益最大风险最小的期权套期保值模型
因为保值收益也是要考虑的一个重要指标,所以设计套期保值策略考虑风险最小的同时,还要考虑到收益最大,为此建立最大收益最小风险模型。
对卖出单位现货保值的最大收益最小风险模型是:
对买入单位现货保值的最大收益最小风险模型是:
两个模型的套期比,分别是:
(11)
(12)
用这两个套期比,确定相应的期权合约数,制定收益最大风险最小的套期保值策略,并且考虑以下的评价指标:
1.收益最大风险最小的套期保值策略的预期收益
把和分别代入(1)式和(2)式,得到相应于 和 的保值策略预期收益分别是:
(13)
(14)
2.收益最大风险最小的套期保值策略的预期风险
把和分别代入(4)式和(5)式,得到相应于和的保值策略预期风险分别是:
(15)
(16)
3.风险最小的套期保值策略的预期效率
类似地,对卖出现货保值和对买入现货保值的效率分别是:
(17)
(18)
五、应用例子
设某锌品企业在2000年4月3日就有计划,要在2000年7月3日买入或卖出一批现货锌,希望交易价格达到x=114%美元/吨。
根据伦敦金属交易所(LME)从2000年1月1日到3月31日三个月的交易数据计算,得到现货价格和期权收益的期望值、标准差,现货价格与期权收益的相关系数如下:
已知4月3日的现货价格,不妨设期权价格,由此就可以设计各种模型的套期保值策略,并且用统计指标进行评价。
1.风险最小的保值策略
对卖出现货保值和对买入现货保值的套期比分别是:,
由(5)式和(6)式,得到相应于套期比和的预期收益分别为:
,
由(7)式和(8)式,得到相应于套期比和的风险分别为:
,
由(9)式和(10)式,得到相应于套期比和的效率分别为:,
由上述指标,就可对两种保值策略进行分析评价。例如,如果企业在4月3日通过买入看跌期权对卖出现货保值,并且每吨现货买入1.8924吨标的物的期权,则每吨现货得到的保值收益为50.6575美元,但保值风险较大,其方差为;保值效率较低,效率值为。
2.收益最大风险最小的保值策略
由(11)式和(12)式,对卖出现货保值和对买入现货保值的套期比分别是:
,
由(13)式和(14)式,得到相应于套期比和的预期收益分别为:
,
由(15)式和(16)式,得到相应于套期比和的预期风险分别为:
,
由(17)式和(18)式,得到相应于套期比和的效率分别为:
,
如果从预期收益判断,4月3日适合对卖出现货保值,而不适合对买入现货保值。对卖出现货保值的策略为:每吨现货锌买入标的物为2.938吨的看跌期权,保值的方案的期望收益是61.2824美元/吨,但是方案的风险较大,效率也偏低,它们的数值分别1129.1612和0.7093。
六、结束语
我国已经加入WTO,越来越多的企业在现货交易中利用衍生工具进行套期保值。但是应该灵活运用衍生工具,而且还要建立更好的模型来设计套期保值策339略。本文提出使用期权作为工具对现货交易进行套期保值,并且通过建立风险最小模型、收益最大风险最小模型来设计套期保值策略,并且设计统计指标对策略进行评价,使企业能够根据指标判断采用哪一种策略。希望做能给企业进行套期保值提供一定的帮助。
参考文献:
[1]约翰・赫尔.期权,期货和衍生证券[M]. 张陶伟译.北京:华夏出版社,1997
Abstract: Multivariate statistical analysis is a branch of statistics,which is rich and have a very wide range of applications. In many disciplines of natural and social sciences,researchers are likely to deal with data that has multiple variables. In this paper,we will discuss the concept,models and analytical steps of the factor analysis.
关键词:多元统计分析;因子分析;模型
Key words: multivariate statistical analysis;factor analysis;model
中图分类号:C93文献标识码:A文章编号:1006-4311(2010)15-0128-02
多元统计分析是运用数理统计方法来研究解决多指标问题的理论和方法。随着计算机应用技术的发展和科研生产的迫切需要,多元统计分析技术被广泛地应用于地质、气象、水文、医学、工业、农业和经济等许多领域,成为解决实际问题的有效方法。多元统计分析中的因子分析(Factor Analysis)是寻找公共因子的模型分析方法,它是在主成分的基础上构筑若干意义较为明确的公因子,以它们为框架分解原变量,以此考察原变量间的联系与区别。其基本目的就是用少数几个因子去描述许多指标或因素之间的联系,即将相关比较密切的几个变量归在同一类中,每一类变量就成为一个因子,以较少的几个因子反映原资料的大部分信息,就是从大量的数据中“由表及里”、“去粗取精”,寻找影响或支配变量的多变量统计方法。
对因子分析模型可以做如下描述:①X=(x1,x2,…,xp)是可观测随机向量,均值向量E(X)=0,协方差阵Cov(X)=∑,且协方差阵∑与相关矩阵R相等。②F=(F1,F2,…,Fm)(m
称为因子分析模型,由于该模型是针对变量进行的,各因子又是正交的,所以也称为R型正交因子模型。
其矩阵形式为:x=AF+ep
我们把F称为X的公共因子或潜因子,矩阵A称为因子载荷矩阵,e称为X的特殊因子。A=a(ij),aij为因子载荷。数学上可以证明,因子载荷aij就是第i变量与第j因子的相关系数,反映了第i变量在第j因子上的重要性。
建立因子分析模型的目的不仅是找出主因子,更重要的是知道每个主因子的意义,以便对实际问题进行分析。还有一个重要的作用是应用因子分析模型去评价每个样品在整个模型中的地位,即进行综合评价。
在上面的分析告一段落后,就可以确定因子分析的步骤。因子分析的核心问题有两个:一是如何构造因子变量;二是如何对因子变量进行命名解释。因此,因子分析的基本步骤和解决思路就是围绕这两个核心问题展开的。
我们来看一个实际的例子,即考察我国各省市社会发展综合状况。
以下是对我国各省市综合发展情况做因子分析。数据表中选取了六个指标分别是:人均GDP(元)X1,新增固定资产(亿元)X2,城镇居民人均年可支配收入(元)X3,农村居民机家庭纯收入(元)X4,高等学校数量(所)X5,卫生机构数量(所)X6。原始数据见表1:
分析过程如下:①将原始数据标准化;②建立六个指标的相关系数阵R;③公因子方差;④总方差解建立因子载荷阵;⑤建立因子载荷阵;⑥对因子载荷阵施行方差最大旋转,旋转后得正交因子表矩阵,由此有:X1=0.947F1+0.178F2-0.115F3,X2=0.940F1+0.105F2+0.261F3,X3=0.893F1-0.0747F2+0.404F3,X4=0.0364F1+0.967F2+0.09455F3,X5=0.212F1+0.830F2+0.345F3,X6=0.222F1+0.493F2+0.806F3;⑦输出因子成份得分系数矩阵。最后,由上述表可见,每个因子只有少数几个指标的因子载荷较大,因此可根据上表分类,将6个指标按高载荷分成3类,列于表2:
由此,运用因子分析的方法我们对国内各省市综合发展情况有了一个了解。
由前面的分析可以得出,因子分析法是从研究变量内部相关的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。它的基本思想是将观测变量进行分类,将相关性较高,即联系比较紧密的分在同一类中,不同类变量之间的相关性则较低,那么每一类变量实际上就代表了一个基本结构,即公共因子。对于所研究的问题就是试图用最少个数的不可测的所谓公共因子的线性函数与特殊因子之和来描述原来观测的每一分量。
在实际问题中要选择适当的方法来解决问题,需要对问题进行综合考虑。应该根据实际情况对问题进行合理的分析与判断,收集相关资料,选择合适的分析方法,建立模型,最后对模型进行诊断和优化处理,并应用于生产实际。
参考文献:
摘要:我国中药发展已有悠久历史,中药大多采用复方制剂,以其复方疗效显著而越来越受到重视,在其成分分析中,多元统计分析方法的运用,本质上是一种多变量协同考量的思路。本文通过对以往多元统计分析方法在中药成分分析数据中的应用作整理总结,对今后相关研究提供理论依据。
关键词:多元统计分析 中药成分分析
中药物质基础的阐明和科学质量控制方法的建立是中药现代化和国际化的关键,在化学计量学中,多元统计分析方法得到了很好的应用,通过优化了化学量测过程,提高分析效果,应用统计分析方法及其他数学方法和计算机软件的应用对其数据进行整理,已较好的阐明了中药物质成分,结构与其性能之间的复杂关系。
一、应用现状
1.1方法
在中药成分分析中,多元统计分析方法如多元回归,多元相关分析,逐步回归分析,最大似然法,判别分析,聚类分析和主成分分析,利用电子计算机能迅速而大量地处理实验数据,还广泛采用了蒙特卡洛(Monte Carlo)统计模拟法,都能在某一特定方面很好的说明其成分,但尚未有统一理论支撑整个体系,也是国内着力于建立中成药数据库的缘由之一。要进一步定性定量的确定中药成分,并很好的分析中药成分还需不断努力。
在应用中,应用最多的为多元线性回归和Logistic回归方法,其次是通径分析,因子分析和聚类分析的运用较少,比如风险模型,典型相关,MCA分析和Probit分析。
1.1.1成分提取
在对中药复方有效成分的整体提取方法,指纹图谱条件优化及定量评价指标,以及基于药理活性的组方条件优化的基础上,化学模式识别方法引入中药分析体系,模式识别,指通过相关软件等用数学方法来实现模式的自动处理和判别,模式识别可大致分为用监督模式识别(判别分析方法),是实现规定分类的标准和种类的数模,并且通过大批已知样本的信息处理找出规律,再预报未知样本的类型,如贝叶斯法(Bayes)逐步判别分析方法,人工神经网络判别法等,无监督模式识别(聚类分析方法),是对一组尚无明确分类的样本,根据它们所变现的变量特征,按相似程度的大小加以归类,最终通过信息处理找出合适的分类方法并实现样本的分类,如系统聚类分析,模糊聚类分析等以及基于特征投影的降维显示方法,另外还有一类基于特征投影的降维显示方法,如主成分分析方法,基于偏最小二乘法的降维方法等,中药的化学模式识别方法可以从复杂的化学测量数据出发,进一步揭示复杂化合物之间的隐藏规律,为中药整体研究提供十分有用的信息。
1.1.2质量控制
在中药复方质量控制方面,近年来,有监督的模式识别和无监督的模式识别往往联合起来使用,即当某中药方剂的总体质量分类不清楚时,可先用聚类分析对原来的样品进行分类,然后再用判别分析建立判别式以对新样品进行判别。
1.1.3药效检验
在化学计量中运用多变量统计过程控制(multivariate statistical process control,MSPC) 方法来处理中药成分组成,在中药分析中,结合对无知复杂多组分进行同时定性定量分析的方法,连用色谱仪器等,包括HPLC-DAD.CE-DAD(毛细管电泳二极管阵列联用仪),HPLC-MS,HPLC-IR,GC-MS.GC-IR等因其将分离与分析技术集于一体,已有很大突破,目前国内在中药成分分析中,运用了在中药化学成分研究的手段方面,如薄层色谱,气相色谱,高效液相色谱,紫外光谱,红外光谱等已得到普遍使用,还包括超临界色谱,高效逆流色谱,色谱质谱连用技术(GC/MS、HPLC/MS),核磁共振(NMR)指纹图谱,x-射线衍射指纹图谱等。其中产生大量的数据,有关研究人员运用数学中多元统计分析方法对其分析,得到相关结论,进而对药效进行更有效的分析。
1.1.4组分分析
借助各类分析仪器以及光谱色谱联用手段,可以再较短的时间内得到大量的多元性化合物信息,该过程所用到的具体方法有聚类分析,主成分分析以及偏最小二乘法,判别式分析法等,中药药效,由定量构效关系到定量组效关系研究
1.2数据处理的应用实例
在对药材产地区分和鉴别研究方面,徐永群等在黄苓的红外光谱的指纹图谱基础上,采用主成分分析法,对多个产地进行了聚类分析。
王继国等分析中药血竭样品的高效液相色谱中,把指纹图谱信息进行数据处理时,用重叠率与相关系数两个参数,从两个方面定量地对图谱进行了相似性评价,在此基础上用系统聚类分析法定性地对样品进行了分类和鉴别,建立了一种相对完善的中药血竭的化学模式识别技术。
杨红娟等对金银花的种类进行了模式识别研究,利用高效液相色谱分析获得金银花的化学信息,并进行了系统聚类分析,同时用微生物法进行抑菌活性测定,用多重线性回归揭示化学信息与药理指标之间的关系。
孙丽新等用典型相关分析对获得反映样品整体化学特征的数据做了处理,并运用聚类的方法将样品分类,得到效果良好的质量控制方法。
周立东等提出在天然药物演技中建立定量组效关系,用以解决中药复杂成分的化学组成与生物活性之间的关系问题,在中药的多变量的化学祖坟空间和中药的多变量空间之间建立起定量的关系,在多元统计分析中,如回归分析,聚类分析以及因子分析西欧提供了操作方法,
二、存在的主要问题
统计方法的选择在一定程度上取决于变量的测度水平,多元统计分析,自变量中包括名义变量的最多,自变量全部为间距测度的很少,多元统计分析方法中序次测度变量和名义测度变量的处理方法一样,所以一般并不加以区分,序次测度变量作为名义测度变量来用,把二者合成为分类变量,本次研究的论文数据中应用多元统计方法时大多数的分析中是分类变量。
2.1方法使用错误
在多元统计分析方法的应用中,如通经分析等存在一些错误,通径分析是建立一组线性回归方程,因此对变量的要求和多元线性回归一样,多元线性回归要求因变量必须为间距测度或以上的变量,自变量可以使分类变量,但当自变量中有分类变量时,必须做虚拟变量回归,而不是普通的线性回归。
2.2数据的评价和检验
对实验数据处理的最终评价是要反映该药效的最好方式,即数据在多大程度上能很好解释了因变量的间的关系,每一种统计分析方法都有自己的数据评价指标和方法。
三、总结
化学计量学提供了一整套区别于传统复方研究的思路,在中药化学,质量控制,药效检验,组方分析,代谢组学以及建立中药数据等各个领域都已有了初步的应用和发展。多元统计分析方法作为数学数据分析中的主要分析方法,虽在中药分析方法中应用存在少数问题,但其应用前景及意义极其乐观。(作者单位:沈阳师范大学)
参考文献:
[1]梁逸曾.化学计量学用于中医药研究.长沙:化学计量学与传感技术研究所,1998.
[2]罗国安.中药中成药现代化进程[M].北京:中成药出版社,2000.
[3]甘师俊,李振吉.中药现代化发展战略[M].北京:科学技术文献出版社,1998.
[4]张敏,吕华瑛.中药成分分离新技术及应用[M].山东:山东中医杂志,2005.
[5]邓书鸿,聂磊.中药谱效关系的分析方法及数据处理技术研究进展.山东:中药材 Joumal of Chinese Medicinal Materials,1819.