时间:2023-06-26 16:15:47
导语:在信息分类标准的撰写旅程中,学习并吸收他人佳作的精髓是一条宝贵的路径,好期刊汇集了九篇优秀范文,愿这些内容能够启发您的创作灵感,引领您探索更多的创作可能。
【关键词】XBRL 通用分类标准 完备性 效率性
一、引言
XBRL自1998年由美国注册会计师Hoffman提出思想框架以来,XBRL在国际上已经获得了迅速发展,多个国家、机构及组织已经实施或正在推行XBRL的应用。分类标准的制定对于 XBRL 财务报告的披露起着规范与模板的作用,其质量直接影响着财务报告信息质量。关于分类标准中标准元素是否能满足上市公司披露需求和是否能有效率地表达财务信息一直是分类标准制定者、XBRL财务报告报送主体、信息披露监管者、信息披露中介乃至投资者都关注的问题,同时也是学术界关注的问题。基于上述的问题,本文主要从完备性和效率性方面对分类标准进行研究。
二、样本选择
本文采取了抽样研究的方法,抽样的总体是2011年上交所所有的A股上市公司。按照10%的抽样比例,以10为步长进行系统抽样。依据中国证监会《上市公司行业分类指引2001》所列的13个行业门类,剔除金融类企业,最终得到本文的93个样本。本文选取货币型财务信息,是因为货币型财务信息为财务报告最基本、最核心的信息,规范易于企业填报而较少出现歧义。并且,大多数企业按照统一规范表格填制财务报表正文,对于正文内容研究意义不大,因此本文仅选取财务报表附注中货币型财务信息作为研究对象。
通用分类标准采用财政部2010年的《企业会计准则通用分类标准》。该标准共计元素2984个,分为13种元素类型。在XBRL报表中表达货币型财务信息的元素是由货币型和Member型元素组成。在1464个货币类型元素和301个Member型元素中,剔除非报表附注元素、金融相关行业元素及首次执行会计准则企业元素。其余元素中,剔除单独列示在财务报表中的元素,得到本文研究对象元素,即非金融行业的附注货币型元素903个,Member型元素300个。
三、研究方法
本文采用人工翻阅公司年报,提取货币型财务信息并与分类标准元素逐一匹配的方法。本文收集了这93家样本公司2011年财务报告附注中的84个报告子项目的披露的货币型财务信息,根据财政部2010年的XBRL通用分类标准对具体披露内容进行判断匹配,匹配成功记为1分值。
四、研究结果
(一)效率性
分类标准的效率性即制定的元素冗余最小,是指分类标准应该在尽量满足企业对于财务信息披露需求的前提下,减少分类标准中的低使用率元素和关系(冗余元素),提高元素使用率。
研究结果表明,企业使用通用分类表中元素总数为1057个,其中Member型元素246个,占分类标准中元素的82%;货币型元素811个,占分类标准中的89.81%。通用分类标准元素制定在效率性方面较好,整体使用率为87.86%。
(二)完备性
分类标准的完备性是指标准体系中所含元素应尽量全面,能覆盖企业对于财务信息披露的所有需求。完备性不足体现在企业报表中披露的财务信息无法在分类标准中找到对应的元素,即分类标准中制定的元素存在不足。
企业因实际需要未能在通用分类标准中找到对应元素而进行元素扩展,共扩展标准未定义元素1145个。整体扩展率(扩展率=扩展元素/总元素集合)为48.76%,其中Member型元素扩展率为54.55%,货币型元素扩展率为46.50%。结果表明,通用分类标准的完备性方面还有很大的改善空间。
五、结论
通过实证研究方法,从通用分类标准元素完备性与效率性两方面,探究通用分类标准是否能满足企业信息披露需求。整体而言,现有通用分类标准元素制定效果在效率性方面较好,但在完备性方面较欠缺,存在本文提到的元素冗余与元素不足的问题。一方面,超过十分之一的元素从未被采用,另一方面,企业需要外扩展更多的通用分类标准未定义元素来满足自身信息披露的需求。通用分类表中在完善过程中应补充不足的元素以提高完备性,同时应剔除冗余元素从而提高效率性,更好地满足企业信息披露的需求。
参考文献
[1]张天西.网络财务报告:XBRL 标准的理论基础研究[J].会计研究,2006(9):56-63.
[2]Chakraborty, Vasarhelyi. Automating the Process of Taxonomy Creation and Comparison of Taxonomy Structures .Working paper,2010,October .
[关键词]优化 信息分类体系 网站
[分类号]G257 C931.6
1 引 言
好的网站信息分类体系对用户、设计者、管理者和维护者都有利。由于网站信息分类体系往往有不一致、冗余等特点,因此需要调整、优化网站信息分类体系。优化网站信息分类体系时,方法是关键,但目前对网站信息分类体系优化方法的研究还很少。
网站信息分类体系优化是对网站现有信息分类体系进行调整的过程。优化网站信息分类体系时,涉及到聚类标准、大类设置、分类体系展开层次、类目种类、类目名称、类目的均衡性和规律性、交叉关系的处理、类目排列、类目的注释和说明、用户的界面设计等内容。这些内容可以概括为特征、粒度、命名、结构、实现等要素。
考虑到网站信息分类体系和网站信息构建(Infor-mation Architecture,n)、网站开发关系密切,本文结合网站IA和网站开发方法提出了网站信息分类体系优化方法,并应用该方法对国家林业局网站进行了优化分析。
2 网站信息分类体系优化方法
网站IA包含了组织、标识、导航和检索系统。网站信息分类体系是网站组织信息的手段,可以视为网站IA的组成部分。网站IA方法对网站信息分类体系优化方法有借鉴意义。学者们提出了众多网站IA方法,虽然这些方法之间存在着差异,但它们均涉及到了分析、设计、实施(即实现)、评价等工作。网站开发也往往涉及到分析、设计、实现、测试(即评价)等工作。网站IA和网站开发方法中的评价工作主要是评价所实现的新系统,因此评价工作被设定在设计、实现等工作之后。
2.1 优化步骤
参照网站IA和网站开发的一般步骤,本文将网站信息分类体系优化工作也分为分析、评价、设计、实现等阶段。为了提高网站信息分类体系优化工作的效率,本文将评价工作设定在设计、实现等工作之前,从而提出一个在设计、实现等工作之后也可以进行评价优化的信息分类体系。于是,网站信息分类体系优化时可能存在着循环、反复。本文所提出的网站信息分类体系优化方法流程如图1所示:
2.2 优化阶段
优化网站信息分类体系时,分析阶段从特征、粒度(层次)、命名、结构等要素的正确性、适量性、可理解性、相关性、一致性等方面完成对现有信息分类体系的分析;评价阶段完成对网站现有信息分类体系质量的评估,并根据评价结果决定是否需要优化网站现有信息分类体系;按照优化内容的不同,设计阶段可以分为特征优化、粒度优化、命名优化、结构优化等环节;这些环节依次优化现有信息分类体系的分类特征、粒度关系、类别名称、类别间关系;实现阶段的任务是根据设计方案调整网站现有信息分类体系,并描述、说明优化后的体系。
2.3 优化方法
网站信息分类体系优化时,可以借鉴已有方法来完成网站信息分类体系的分析、评价和实现工作。本文借鉴文献中网站信息分类体系的质量框架来分析现有信息分类体系,用文献提出的指标体系来评价网站信息分类体系质量,用网站设计方法来实现网站信息分类体系的调整和描述。于是,本文中网站信息分类体系优化工作的关键挑战是找到设计阶段征优化、粒度优化、命名优化和结构优化等方法。
特征优化的任务是选择最合适的特征组合,可以采用自顶向下方法优化特征。自顶向下特征优化方法是在分类模式的基础上确定候选特征集合,再按照特征覆盖度大小筛选出所需的特征,并对特征进行细微调整得到特征组合;粒度优化时,需要判断粒度粗细是否合适、不同元素间的粒度是否均衡、粒子内部元素之间聚合度高不高,可以使用粗粒度优先方法优化粒度。粗粒度优先的粒度优化是指直接使用最粗的粒度关系或者基于相似度对较细的粒度进行合并、调整;为了保证用户熟悉类别名称,命名优化时要尽量使用通用的词语来命名类别,可以采用基于统计的命名优化方法。基于统计的命名优化是指用统计方法选择出现频率高的现有体系或同类网站中词语来命名类别。命名优化的任务还包括对错误类目名称的调整;结构优化方面往往采用自底向上逐层结构优化方法来优化结构,即在确定网站信息分类体系的层数的基础上,从最细粒度开始到最粗粒度根据类别之间的隶属关系、类别的重要性确定类别的位置。
3 应用上述方法优化国家林业局网站现有信息分类体系
表1是国家林业局网站(forestry.省略)“生态建设”部分现有信息分类体系:
分析上述信息分类体系,可以发现它有以下特点:
・类别偏多。国家林业局网站现有信息分类体系1层所包含的第4层或第3层(没有第4层时)的类别总数为307,而我国中央政府门户网站(省略)和国家农业部网站(agi.省略)1层所包含的类别总量分别只有79和78。
・层数偏多而且不均衡。国家林业局网站现信息分类体系最多有4层,如“生态建设”及其子类就有4层。其中,第3层类别总数为189,有第4层子类的第3层类别占第3层类别总数不到12.2%。体系中第3层和第4层类别的名字长度和子类数量差异比较大,许多类别只有一个子类且上下级类别名称相同(即单一子类)。不同层的类别间还有重名的现象。
・兄弟类别间关系不强。如聚合度不高,且所依据的分类特征不相同。
・现有分类体系中一些类别名称(如“网站地图”、“联系我们”)的含义和通常人们理解的含义不一致,有歧义。
・现有分类体系中很多第4层或第3层类别的信息量比较少。
・现有分类体系中政务公开相关的类别偏少,无法体现电子政务网站的特点。
分析这些特点,可以发现:国家林业局网站现有信息分类体系存在着类别偏多、粒度偏细、层次偏多的问题。这使得设计现有信息分类体系时需要大量的分类标准,从而增加了网站信息分类体系设计工作的难度。进而导致了现有体系存在着名称重复、兄弟类别之间聚合度不高、大量单一子类等问题。根据上文对现有体系的分析和文献中对现有体系的质量评价结果,可以知道现有体系还需要进行优化。已有的分析、评价为设计工作指明了方向:可以采用减少特征、粗化粒度、减少类目数量、减少层次、减少命名歧义性、提高命名长度一致性等措施来优化国家林业局网站现有信息分类体系。
按照自顶向下特征优化方法,先确定网站信息分类体系第1层类别的候选特征集合。林业电子政务网站有主题、原型、功能、实现、对象、地域、时间、角色等分类模式。考虑到网站侧重于监管、林业信息化建设相对薄弱等情况,可以以主题、原型为主要分类模式。应用主题分类模式时,从产业视角可以划分成木材加工、经济林果、苗木花卉、生态旅游、生物质能源等类别,从业务视角可以划分成造林绿化、防沙治沙、自然保护等类别。应用原型分类模式时,可以划分成文件、公告、公示等公文类别。用同样的分析方法,可以得到业务、产业、市场、公文类别、来源、媒体、语言、技术、交互方式、可实现的任务、相关机构、相关人物、时间、地域等特征组成的候选特征集合。通过对国家林业局网站现有信息进行归类,考虑到特征覆盖度的大小,可以筛选出业务、资源形式、交互目的、产业等四种分类特征。另外,考虑到网站信息分类体系中有许多链接到独立网站的类别,可以增加导航特征。因此,优化后的信息分类体系有业务、资源形式、交互目的、产业、导航等分类特征。
由于现有信息分类体系粒度偏细,粒度优化时的主要任务是基于相似度对现有部分类别进行合并。考虑到天然林保护、退耕还林、防沙治沙、湿地保护、公安防火等信息和自然保护有相关性,可以将它们进行归并成生态保护;同样原因,将义务植树归并到造林工作下。对现有信息分类进行命名优化时,主要是采用体系中已有词语来命名类别,调整了部分类别名称。对现有信息分类进行结构优化时,先确定总层数为3层,再自底向上根据类别之间的关系并兼顾类别的重要性确定类别的位置。优化后的信息分类体系逻辑结构如表2所示:
[关键词] 信息组织分类主题一体化信息服务行业号百信息分类法
随着社会信息化进程的加快,社会中存在的各种行业、产品信息不断膨胀。这些信息在没有被有效地组织之前犹如一盘散沙,只有对其进行科学的组织,才能够充分发挥信息的使用价值,满足用户的检索需求。
近年来信息服务行业的蓬勃发展正适应了用户对信息组织的需求,该行业通过对社会中的各类行业、产品、知识进行有效的分类整合,建立相关索引以方便信息的查询,从而使用户或企业管理人员能够快速准确地获取相关信息,从而降低社会信息流的混乱程度,促进信息共享和信息有效访问,提高信息产品的质量和价值。可见,信息服务行业所采用的信息组织方法是该行业发展的关键,对其业务开展及服务质量具有直接性的影响[1]。
1 信息服务行业的信息组织方法及问题
最初的信息分类来源于图书馆的文献分类,随着互联网的迅猛发展,企业所接收和提供的信息量迅猛增长,人们对信息检索的需求量也越来越大。分类法的应用范围逐渐深入到各类信息服务行业中。目前,分类法在信息行业中主要应用于网站管理、搜索引擎服务、信息查询服务等方面。该行业所采用的信息组织分类方法主要有以下几种:
1.1 传统分类法
传统分类法指用于组织、整理图书馆藏书的分类法。如国外的《杜威十进分类法》、《国际十进分类法》、《美国国会图书馆分类法》等。在我国,最具代表性的传统分类法是《中国图书馆分类法》。传统分类法主要以文献为主要处理对象,其分类体系为等级列举式结构。
传统分类法以科学分类为基础,词汇选取规范,具有严密的逻辑性与结构完整性。但同时,传统分类法的单线型列举式的“树状”结构,不能反映现代信息的多元化发展。并且,传统分类法在表达类目、主题之间关系方面采用参见、组配、注释等方式,对于分界模糊、交叉性强的日新月异的行业产品综合信息也有很大的不适应性。此外,传统分类法的专业性对于信息服务行业面对的最终用户来说缺少易用性[2]。
1.2黄页企业分类法
黄页企业分类法是以分类法为核心思想并结合企业特征发展而来的一种信息组织方法,目前已被广泛应用在企业管理和业务模块等方面。黄页企业分类法主要以各种企业、组织机构为对象,是将企业信息根据产品或服务的特性进行归类后按一定方法编排的名录[3]。
黄页企业分类法能按专业集中地、系统地揭示企业性质,可使使用者整体清晰地把握企业特征,并且保证了高度的检全率。但是,现代企业从事产品趋于多元化,产品之间互相渗透和综合,因此,充分地、合乎客观实际地反映多维性的企业性质变得越来越复杂和困难。这使得对一些企业的专业范围很难界定,黄页企业分类法在检准率方面面临着非常大的挑战 。
1.3 人工分类法
人工分类法是以人工标引或自动标引方式采用自编的分类系统。目前大量网站和搜索引擎都采用人工分类法对网络信息进行分类组织。这些自编的分类体系以用户为中心,充分考虑到了最终用户的需求特点。
与传统分类法相比, 人工分类法通常以主题为核心建立分类,并且突出用户关注和需求的类目,词汇选取更加通俗易懂。此分类法最突出的特点是可以动态组织分类体系,根据需要随时调整或组织相关资源,具有较强的灵活性和适用性。但由于分类人员缺乏专业性,且内容未经严格审核,随意性较强,因此造成类目设置模糊、交叉严重,知识领域不全, 缺乏规范性、规律性等问题[4]。
1.4 全国主要产品分类与代码
《全国主要产品分类与代码》是我国于2002年颁布的产品分类标准。该分类法由可运输产品和不可运输产品两部分组成,以我国工农业商品和物资为处理对象,是产品分类法的代表,对我国生产领域产品的产量、产值等各种不同类型的数据处理和准确统计提供一个分类依据。
该分类法在信息日益更新的今天并没有及时进行动态维护管理,原标准已难以适应和满足社会的需求。并且,该分类法仅以产品为主要处理对象,标准的覆盖面不够宽,无法满足对多类型的信息进行组织的需求。
上述各种信息服务行业现存的分类体系分别以文献信息、行业信息、产品信息为处理对象,缺乏对行业、产品综合信息的系统完整的信息组织,并且普遍存在更新不及时、体系结构不能满足现代信息的多元性、交叉性的问题。因此,需要从现代信息的特点出发,建立符合大众需求的、对行业产品综合信息进行有效信息组织的新型组织方法,以适应用户的信息需求。
2 信息组织方法在号百公司中的应用
中国电信集团号百信息服务有限公司(简称号百公司)是中国电信股份有限公司的全资子公司。“号码百事通”是号百公司的龙头业务,是一切基于中国电信114台的增值业务的统称,其目的就是要在充分挖掘和整合用户号码信息的基础上,延伸和拓展传统的查号业务,满足用户现实和潜在的各类信息查询需求 。
对于号百公司这样一个信息查询服务行业的典型代表,良好的信息组织方式是其发展的核心竞争力所在。号百公司在遵循和借鉴传统分类法知识体系和现行的多种行业和产品分类体系的基础上,针对号百自身的业务服务特色及用户需求特点,设计并研制出了符合号百信息组织需求的信息组织工具――《号百信息分类法》。
2.1 《号百信息分类法》概述
号百公司所采用的信息组织方法是集“行业―产品―知识”三者为一体的综合性、分类主题一体化的《号码百事通信息分类法》(以下简称《号百信息分类法》)。它以服务机构(行业)为主要出发点,科学和实用地展示与组织相关的服务产品以及与服务产品相关的知识,同时满足行业、产品、知识的分类组织和主题组织的需要,满足信息服务的整序需求。
《号百信息分类法》采用了“分类―主题一体化”的编制结构,将分类法与主体法结合起来,实现对信息的内容描述和检索功能均从分类和主题两个角度进行,公司可以完成对行业信息的分类标引和主题标引,用户也可以在统一的检索系统中进行字顺主题查询和系统分类查询。既能独立完成主题标引的功能,满足特性检索的要求,又可以独立完成分类标引的功能,满足族性检索的要求,从而把信息组织、信息检索的系统性与直接性结合起来,同时建立主题词与关键词之间的关联关系,作为主题语言与自然语言的接口。
2.2《号百信息分类法》的编制特色
2.2.1类目具有高涵盖性《号百信息分类法》的编制遵循“具有高涵盖能力,包括全行业和产品信息,将各类信息的行业属性、产品属性与知识属性有机地融合起来”的编制原则。该分类体系的类目最细为6级,设置了34个一级类目,在一级类目之下,以行业为主要聚类依据,划分出相对独立的、具有市场分割性质的二级类目,形成行业的基本架构;三级类目过渡到行业、产品、知识兼顾的立类;四、五、六级类目是主要以产品、事物、知识为主的立类 。该分类体系片段如图1所示:
由上图可以看出,《号百信息分类法》将行业分类、产品分类和知识信息充分地综合在一起,以便从多个角度同时满足公司的业务开展需求及用户的信息搜索和服务需求。此外,公司在进行行业、产品分类时,通过类目的参见及主题词间的语义关联建立知识间的联系,使得行业分类与产品分类之间具有更强的紧密性和扩展性,便于用户在检索中便捷全面地检索到行业及产品信息。
2.2.2分类体系的强易用性《号百信息分类法》致力于整合行业、产品的信息资源,提高广大用户的检准率和检索效率。其面向的检索用户并不具备专业的检索技能及准确的分类概念。针对这一特点,《号百信息分类法》的类目体系增强易用性,相对弱化科学性。具体表现在:类目的详细程度与检索的信息量和查询频率相匹配,以满足用户在日常最关心的领域的信息检索需求;注重多重列类,即在同一划分阶段,同时采用几个标准对上位类概念进行划分,从而获得几组并列的同位概念,给用户提供尽可能多的检索途径;类目展开深度控制在6级,避免不具备精准检索知识的普通大众因类目层级过深而导致无法准确高效地找到所需信息情况的发生。
2.2.3词汇选取从大众出发《号百信息分类法》在词汇选取方面充分从方便大众的角度出发,借用丰富的入口词提高自然语言的检索能力,并且大量使用词组以贴近用户的检索习惯。在选择入口词方面,收录丰富的、对词形规范性要求不甚严格的关键词,在很大程度上增加了检索入口,提高自然语言的检索能力,从而增加了终端用户检索的便利性。与此同时,《号百信息分类法》在使用概念组配的同时,大量收录了高先组度的词组以贴近大众的检索习惯,在满足信息多向成族需要的同时提高检全率。
3 《号百信息分类法》面临的挑战及对策建议
《号百信息分类法》是信息组织方法在非图书文献领域得以应用和创新的典型代表。必须意识到,其蓬勃发展的同时仍然面临着严峻的挑战。面对分界模糊、交叉性强、更新速度快的行业信息以及多用途、交叉领域的产品信息,如何将这些错综复杂的数据进行有效的标引以充分揭示各类信息是个不小的难题。此外,《号百信息分类法》集“行业―产品―信息”三者为一体,在增强了分类类目的关联性及扩展性的同时,也加大了管理人员对其维护和更新的困难性。对此,笔者试从以下3个方面提出对策建议。
3.1建立强大的参照系统,揭示知识空间的立体联系
针对行业及产品信息错综交叉的特点,采取以参照系统建立的网状关系将交叉领域的信息相结合。因此,不仅要建立交叉关系和相关概念的参照,而且需要建立不同的表示方式(如检索词和分类号)之间的混合参照;从同一检索系统内的参照到多个检索系统间的参照;从单一行业内的参照到多行业之间的参照;甚至可以在不同系统、不同行业、不同产品、不同表示方式之间建立强大的参照系统,使各类目间形成功能强大的网状结构,从而建立和规范交叉信息之间的关系,客观而充分地揭示知识空间的立体联系,供用户从不同的角度进行检索[6]。
3.2鼓励用户参与,提供丰富的用户体验
“用户中心”是Web2.0的重要理念。鼓励用户参与,提供更丰富的用户体验,让用户不止是号百信息库的使用者,还要成为号百信息库的建设者。针对行业及产品信息更新速度快的特点,通过与用户的互动,充分利用群体智慧来建设号百信息数据库。允许用户对行业或产品记录进行标注、评论或者更正,让用户真正参与到号百信息库的建设中来。
3.3建立多维系统,提供多途径、多类型的检索
为了适应多元性的、交互性的、动态的网络信息环境,可以打破分类法传统的“线性”资源组织方式,采用分面分析的方法。在类目体系纵向展开上, 使用多维划分和多元展开的形式为一种信息赋予多个类号, 并且可以同时设置多个类目体系, 建立多维的系统,从而提供多途径、多类型的检索,以满足情报的多维检索需要。这种多途径的检索方式使更多的主题概念进入分类体系, 这使得用户可以从不同的角度进行检索,在一定程度上大大提高了信息的检全率和检准率[7]。
在互联网时代,帮助用户高效检索所需求信息的信息服务行业,地位不断攀升。信息组织方法是信息服务业生存和发展的关键技术。信息服务业中的信息组织技术必须充分吸收传统信息分类法的成熟理论,在此基础上,结合信息服务的业务特色、信息用户的搜索需求及检索特点,才能够使其在信息服务行业中得以有效地应用。信息服务业需要加强对信息组织的重视以提高企业的竞争力,而信息组织的方法本身也需要不断完善和发展,以适应复杂多变的用户搜索要求[8]。
参考文献:
[1] 李卫红,沈保全. 信息组织方法述略.情报杂志,2004,22(1):67-68.
[2] 邓均华. 网络分类搜索引擎与传统分类法之比较分析――兼论建立我国信息组织分类标准. 河南图书馆学刊,2001,21(5):60-61.
[3] 周毅俊. 黄页检索语言探索. 中国索引,2005(2):30-32.
[4] 武利红,李振红. 分类法在搜索引擎中的运用思考. 图书馆学研究,2005(6):48-50.
[5] 刘苏南.信息组织在中国电信信息服务中的应用. [2010-12-02].省略index.fudan.省略/lwj/2008/liusunan.ppt.
[6] 苏瑞竹,吴英姿.利用分类法和主题法改善搜索引擎的性能. 情报科学,2001,19(11):1170-1175.
[7] 马张华. 分类搜索引擎对分类法发展的贡献及相关问题讨论.中国索引,2005(3):14-18.
[8] 王衍,丁梅娟. 论企业信息资源的组织管理与开发利用. 科技进步与对策,2002(7):115-116.
[作者简介]彤,女,1989年生,本科生。
关键词农业信息分类;存在问题;网状结构;原理;原则;优点
中图分类号G201文献标识码A文章编号 1007-5739(2011)03-0047-03
AgricultureInformation′sClassificationBasedonReticulateFrame
YU Xin-kai 1LI Bin2MAO Min 1
(1 Guangzhou City Construction College,Guangzhou Guangdong 510925; 2 Guangzhou Agriculture Information Center)
AbstractBased on analysis of the system of agricultural information resources at present,a new measure so-called classification based on reticulate frame was brought forward,which helped to construct a scientific,efficient,lively system for the information resources.
Key wordsagricultural information classification;problems;reticulate frame;theory;principle;advantage
自1994年实施“金农工程”开始至今,农业类信息网站由最初的“中国农业信息网”(1996年建成)发展到目前已经超过3万家,2009年前8个月就增加了逾8 000家,增长率达到38%,远远高于全国互联网站平均增长速度[1]。
综合对比全国各地的农业类信息网站,虽然我国各类农业信息系统在数量上和规模上一直处在持续增长势头,农业信息资源也不断地充实扩大,但由于农业行业所涉及的相关领域十分广阔,知识与信息内容繁多;加之我国在农业信息化建设方面尚未建立统一的数据标准,使得众多农业类信息系统在信息采集、内容组织与展现、数据挖掘方面都各不一致,以致难以实现信息的高效共享,不利于信息资源的开发利用。
1农业信息资源的基本涵义
根据中国电子信息产业发展研究院的定义:农业信息化是指利用现代信息技术和信息系统为农业产供销及相关的管理和服务提供有效的信息支持,并提高农业的综合生产力和经营管理效率的相关产业的总称。具体内容包括:农民生活消费信息化;农业生产管理信息化;农业科学技术信息化;农业经营管理信息化;农业市场流通信息化;农业资源环境信息化;农业管理决策信息化[2]。
根据《全国工农业产品(商品、物资)分类与代码》(国家标准GB7635)的分类,农业作为第一产业,其包括农业产品、营林产品、人工饲养动物与捕猎的野生动物及其产品、渔业产品、观赏植物和其他农、林、牧、渔业产品等六大类[3]。
据此,笔者认为对农业信息资源进行严格的、层次分明、界限明显的分类是比较困难的,其不像教育、社会保障、医疗卫生、交通运输、房地产等领域的信息资源那样具有较高的内聚度和信息受用者的单一性、确定性和稳定性。通过对比很容易看出农业网站的信息内容“大而全”的特征面貌。
2对农业信息资源进行分类的必要性
“农业”是一个范畴非常广泛的概念,凡是与农业相关的信息都可以作为农业信息――这几乎是目前所有涉农网站信息内容所表现出来的“默认”看法或做法,是合乎逻辑、无可非议的。问题是,如果凡是信息皆为“信息”,那么让信息受用者在这样海量的信息世界里找答案就像是让他们在图书馆里找法律条文一样难。因此,有必要对农业信息资源的分类和呈现进行系统的技术分析,建立一个科学的、规范的、精简的、高效的、实用的农业信息资源体系,使农业信息从最初的形成,到加工,再到最终的呈现,整个生存周期都能一直保持“所见即所得”的理想状态。即让信息受用者通过最简便的方式,在最短的时间内获取其认为有价值的信息。
3现阶段农业信息的分类状况
3.1常用的分类方法
按照传统的分类方法,根据不同的维度[4]作为标志对农业信息资源进行分类,常用的分类方法有以下几种:一是按信息所涉及的活动行为划分,可分为农业行政管理、生产管理、经营管理、市场流通、农业科研等信息。二是按信息所涉及的商品对象划分,可分为粮油、蔬菜、水果、水产、畜禽、花卉、农副产品、生产资料等信息。三是按信息内容的表现形式划分,可分为文本、数字、图表、图片、声音、演示稿、视频、地理信息等多媒体信息。四是按信息表达内容所属的文种划分,可分为政策法规、政务公开、新闻报道、价格行情、科普知识等信息。五是按信息所体现的功能作用划分,可分为政务办理、信息查询、在线论坛、问卷调查、上传下载、电子商务等。六是按信息发生的时间划分,可分为历史信息、当前信息和预测信息。七是按信息的时效特征划分,可分为实时信息、准实时信息和延时信息。八是按信息的空间范围划分,可分为世界、全国、各地方的农业信息。九是按信息内容变化的频度划分,可分为静态信息和动态信息。以上各类分类方法在文献表述上是可行的,根据研究对象侧重点的不同而采用不同的维度进行分类。但是将包罗万象的农业信息资源注入到一个相对不区分研究对象的农业信息系统中去,并同时保持各类信息之间清晰的界限和层次结构,这就不是一件容易的事。
3.2传统分类方法存在的问题
一般都采用树形结构对农业信息资源进行分类,这也是目前大多数农业网站所采用的一种方法。这样的分类方法就其效果而言是比较直观、易于理解,便于内容的组织与归纳(图1),但其一方面忽略了各分支节点的内容交叉性;另一方面切割了各分支节点之间的内在客观联系。
一个典型的例子就是水果农产品的分类,按果类品种可分为苹果、荔枝、龙眼、芒果等,一些农业网站相应地分别开设荔枝信息栏目、龙眼信息栏目等,但若同时也开设了“农科园地”栏目时,那么关于荔枝栽培技术的信息应该放在“荔枝专栏”还是“农科园地”呢?
对于分支节点的内容交叉性问题,有人曾提出笛卡尔积的解决办法,即N1×N2×……×Nm×……×Nn,其中n是维度数,表示有n种分类方法,按每一种分类方法可将农业信息分为Nm类,以此来达到完整地覆盖所有分支节点的目的(图2)。
举个例子,比如某农业网站有3个信息栏目:一是栽培技术栏目下开设了荔枝、龙眼、芒果等子栏目;二是荔枝栏目下开设了栽培技术、市场信息、名优品种等子栏目;三是市场信息栏目下开设了畜禽、水果、花卉子栏目,水果子栏目下又开设了荔枝、龙眼、芒果等子栏目。按照这种设计方法,栏目的数量和其结构的复杂度将按级数递增,无论是内容的管理策划者还是信息浏览者都很容易陷入迷宫阵,既不方便内容的管理又不利于信息的传递,同时又造成了大量冗余的信息重复出现。
本文为全文原貌 未安装PDF浏览器用户请先下载安装 原版全文
对于按树形结构分类法,则会隐藏掉事物间的内在客观联系规律。例如将关于荔枝、龙眼的产量、上市信息分别放置在荔枝专栏和龙眼专栏中,则会让人难以发现这2种水果在产量和销量方面的联系。实际上,在珠三角地区能种植荔枝的地方一般也可以种植龙眼,而且是在同一季节收摘和上市的,同时面向总销量比较稳定的消费市场。因此它们之间的产量和销量肯定会存在一定的客观联系,而这些规律正是数据挖掘者所关心的,因为这些相关数据正是创造信息价值所依赖的基础,是实现信息资源二次开发利用的关键因素。
4网状结构分类法的实现
4.1网状结构分类法的原则
在构建网状结构的农业信息分类体系时,应当把握好以下原则:一是科学性原则[5]。所选择的维度标志必须能反映事物的本质特征并具有明显的区别功能和稳定性,以满足分类的客观要求。二是系统性原则。每一个分类维度标志的内涵都必须是互相独立、无重复的,所有维度标志的总和所涵盖的内容能够构成完整的农业信息范畴和领域。三是规范性原则。分类首先应该符合相关的国家标准、行业标准和其他规范性文件。四是实用性原则。应充分满足生产、流通及消费的需要,同时要有利于数据挖掘和知识发现。五是扩展性原则。要事先预见并设置或预留足够的类目,以保证在新事物出现时不至于打乱已建立的分类体系和结构。六是兼容性原则。即同一个信息单元出现在不同的类目时,既不会带来信息冗余,也不会产生内容上的歧义。
4.2网状结构分类法的设计原理
在数据仓库理论中有一种数据组织模型叫做数据立方体,是n维笛卡尔积空间的表现为三维的形式。网状数据结构则是结合上述的树形数据结构和n维笛卡尔积空间结构经过改进演化而来的(图3)。
4.3构建步骤
一是将农业信息资源按照树形结构分类,如图1所示;二是调整每一个维度及其分类的位置并旋转一定的角度,形成一个有边界的多边形整体效果,将所有的农业信息单元数据对象放在这个全集空间中考察;三是对于实践中所生产的每一个信息单元,先根据信息的主要功能与价值确定其直接归属的栏目,用实线连接该信息单元和其宿主栏目;四是考察信息单元与其他栏目的关联性,关联性强的用虚线连接,关联性弱的则不连接;五是当所有的维度分类和信息单元都在这个全集空间中标示出来时,再把该模型放到立体空间去观察,最后得到一个球形网状的结构模型[6]。
5基于网状结构的农业信息分类技术的优点
一是有效地考虑到了不同维度的交叉部分,实现了各类农业信息的相互兼容性,消除了信息损耗。二是有利于揭示不同信息单元之间的内在客观联系,为进一步的数据挖掘和信息资源开发利用提供很好的原始数据。三是消除了笛卡尔积分类结构带来的大量多余的、空的、无意义的冗余信息,使整体结构更加清晰,同时也为物理设备节省了大量的存储空间。四是所有信息单元与其宿主栏目和关联栏目都用连线连接,使得整个分类系统更加富有组织性、有机性,为信息的查询、检索、汇总统计提供了丰富的线索。五是使得信息采集、编辑工作更加高效,例如对于一则标题为“荔枝农庄新景象,现摘现买又观光”的信息,同时兼有新闻、市场行情、休闲观光等性质,既可以放在水果栏目又可以放在新闻栏目,按传统的分类方法,经常会给网站信息工作者带来烦恼和随意性。而按网状结构分类方法,将荔枝专栏作为该则信息的宿主栏目,同时为其附加上新闻、市场、观光、图片等维度的属性标记,再通过一定的信息呈现技术手段,使得信息浏览者在相关栏目下也能获取该则信息。
6结语
农业信息化建设在全国范围内取得如此迅速的发展,在很大的程度上得益于国家同时对农业基础设施和IT产业的大力投入[7-8]。从基础设施的建设规模来看,确实取得了长足的发展,许多边远山区都得到了信息服务的延伸和覆盖。但基于目前大多数农业信息系统的发展现状,我国的农业信息服务水平在功能与效用方面还处在粗放型的阶段。基于网状结构的信息分类技术为如何进行农业信息资源的深度数据挖掘和开发利用提出了解决思路,在分类技术上提出了更加适合于我国农业信息资源体系建设的解决方案。
7参考文献
[1] 王法英,孙锐.中国农业网站基本情况分析报告[EB/OL].(2009-10-16)[2010-11-03]..
[2] 搭建信息化平台推进新农村建设[EB/OL].(2010-03-18)[2010-06-20].省略/art/184371201003/8/2015483-1.html.
[3] 国务院.GB7635.全国工农业产品(商品、物资)分类与代码(国家标准GB7635-87)[S].北京:中国标准出版社,1987.
[4] 王健,甘国辉.多维农业信息分类体系[J].农业工程学报,2004,20(4):152-155.
[5] 严方.试论互联网农业信息分类的原则和方法[J].安徽农业科学,2007.
[6] 罗德一.农业网络信息分类体系初探[J].农业图书情报学刊,2010(8):84-87.
[7] 牛振国,崔伟宏,符海芳.多维网络农业信息分类框架的初步研究[J].农业系统科学与综合研究,2003,19(4):274-277.
[8] 郭书普.网络农业信息分类和编码的研究[J].农业图书情报学刊,2003(6):139-141.
【关键词】集控站;信息;优化
1.前言
随着集控站在全省范围内的逐步推广和使用,远动自动化信息优化意义重大。从集控站和电网调度关系的层面来说,变电站事故主要由集控站监控人员进行决策、判断和处理,电网调度负责整个电网运行方式执行及事故决策和处理。
2.集控站远动自动化信息分层分类范围和目标
本文以沱河集控站为例,进行集控站自动化系统信息优化,实现远动自动化信息分层分类。
远动自动化信息性质层面上的分层分类。根据电网信息的重要性,集控站自动化系统需将电网事故、异常信息按不同类别在告警窗口上分类显示;编制远动自动化信息分类规范,为今后变电站自动化信息接入范围提供标准。
集控站用户界面层面上的信息分类。编制典型的用户交互界面,为集控站监控人员进变电站的设备巡视和事故处理,提供方便、快捷的手段。事故处理时,能依据事故来源进行迅速溯源。通过事故告警,定位变电站一、二次系统,通过一二次设备的关联信息,使运行值班人员迅速定位事故发生地点。
3.远动自动化信息分层分类的主要做法
3.1变电站自动化信息分类
将变电站运行信息分为四种基本类型:事故信号、第一类告警、第二类告警及第三类告警。
事故信号:事故信号事故总,保护、自动装置动作,断路器跳闸信号
第一类告警:设备故障告警,异常运行或过负荷等信号;第二类告警:系统波动干扰,参数越线等信号;第三类告警:正常运行信号,操作信息、主变调节分接头,特殊控制等。
将变电站一、二次设备状态、动作信号进行分类,在变电站新建、改造时,该分类作为该变电站远动基本的和必需接入的信息。
事故类:变压器各种电气量保护动作、保护出口信息;变压器各种非电气量保护动作及保护出口信息;变压器开关变位信息;开关各种保护动作、保护出口信息、开关变位信息;压变二次空气开关跳、压变二次回路断线;所用变低压总开关跳及故障;直流系统接地及交流输入输出故障
第一类告警:变压器过负荷、油位高低、压力释放动作、保护装置告警、闭锁调压、超温、冷却装置故障类的信息、冷却装置电源故障;开关控制回路断线、弹簧未储能、气体压力低类、气压低闭锁操作类、液 压机构压力低、保护装置异常告警、液压机构压力低、保护装置异常告警、保护闭锁、机构箱内的各种异常告警信息;电压回路断线、电流回路断线、互感器气压低、互感器需补气等信息、计量用电压 消失、保护用电压消失;交直流回路缺相等、交流系统设备运行故障告警
第二类告警:各级母线电压越线
第三类告警:遥控操作信息、正常操作开关变位信息、主变分接头调节信息、刀闸变位信息、压变二次并列信息、保护装置及远动装置上的操作信息、远动及监控系统运行信息、开关把手远方就地信息、变压器冷却装置运行
3.2集控站用户界面层面上的信息分类
在集控站自动化系统上,通过信号关联和画面制作,完成典型用户交互界面的编制。
变电站正常运行时,显示绿色,发生事故或告警时,该变电站时显示为红色。分类依据:以每个变电站分别定义为独立的信息对象个体,当该站任何动作事件而没有复归确认时,光子牌信号显示红色。点击某个变电站则进入该站的平面布置图。
某变电站发生事故或告警时,显示该变电站平面图内。变电站平面图内容包括:主控制室、110kV设备区、35kV设备区、1#主变设备区、2#主变设备区、10kV开关室等,每个设备区内均显示各间隔的运行状态,异常时,该设备区某间隔光子牌显示为红色。点击某个设备区,则以弹出式窗体,列出该设备区内各间隔所有信号状态。其中,为了事故处理时能及时掌握现场情况,加入了“微机保护动作查询”功能。需要一提的是,所有二次设备信号均归类到相应的一次设备间隔内,目的是减少监控人员操作画面的次数,以提高事故处理的效率。
3.2.1开关类
进入该区域后,系统将按照一次开关等设备间隔,显示该开关及其机构的状态信息。
信息分类规则:按设备间隔(110kV变电站开关类间隔信息内容)
开关机构异常类:开关弹簧未储能、气体压力低类、气压低闭锁操作类、液压机构压力低、保护闭锁、机构箱内的各种异常告警信息、开关状态信息
保护动作类:开关控制回路断线、两侧刀闸状态、保护装置异常告警、保护闭锁、保护电压消失、各种保护动作及出口信息、保护装置的操作信息、远控/就地把手状态
互感器类:电压互感器的低压空气开关跳、互感器气压低、互感器需补气等信息、计量用电压消失两侧刀闸状态、压变二次并列、PT失压、二次回路断线等状态信息
3.2.2主变设备区,按照变压器本体及保护两类按照变压器间隔合并归类变压器本体动作类:油位高低、压力释放动作、闭锁调压、超温、冷却装置故障类的信息、冷却装置电源故障、有载调压装置故障类的信息、有载调压装置电源故障、中性点刀闸位置等变压器保护动作类:过负荷、各种电气量保护动作及保护出口信息、各种非电气量保护动作及保护出口信息、变位信息
3.2.3交、直流设备类型
交流系统:所用电电源故障、所用电空气开关跳等信号
直流系统:电压过高、电压过低、母线接地、充电机故障、直流系统交流失电等状态以及异常信息
4.推广应用
通过集控站远动自动化信息优化,提高电网监控效、减少电网故障处理时间,有利于保障电网安全可靠运行。在集控站自动化系统上,通过信号关联和画面制作,完成受控站典型用户交互界面的编制。
某变电站发生事故或告警时,显示该变电站平面图内。变电站平面图内容包括:主控制室、设备区、主变设备区、开关室等,每个设备区内均显示各间隔的运行状态,异常时,该设备区某间隔光子牌显示为红色。信息分类依据:以每个设备区内设备间隔定义为独立的信息对象个体,当该设备间隔内任何动作事件而没有复归确认时,光字牌信号显示红色,点击某个设备区,则以弹出式窗体,列出该设备区内各间隔所有信号状态。其中,为了事故处理时能及时掌握现场情况,加入了“微机保护动作查询”功能。需要一提的是,所有二次设备信号均归类到相应的一次设备间隔内,目的是减少监控人员操作画面的次数,以提高事故处理的效率。
由于二次保护部分已归类到相应的一次设备间隔中去,主制室设备区主要包含交流系统、以及直流系统等类型。分类依据:按交、直流设备类型。
【关键词】网页;分类;www;林产品;TF-IDF;SVM
1.引言
根据中国互联网信息中心(CNNIC)的最新数据显示,截止到2013年12月底,中国网民数量达到6.18亿,国内网站达到320万个,伴随着互联网的迅速普及,我国的林产品贸易信息类网站也日益成熟,林产品贸易信息的数量急剧增加,用户面对海量的数据信息很容易产生信息迷航,针对这些问题林产品贸易信息聚合网站应运而生。此类网站通过爬虫程序将分散在互联网上各个站点上的林产品贸易信息进行汇总,但是不同林产品贸易网站之间的分类体系差别巨大[5],如何将汇总的信息按照统一的分类体系进行划分,以便为用户提供快速的导航式查询成为林产品贸易信息服务中的重要一环。本文选取了SVM作为分类器。SVM是Vapnik等人在多年研究统计学习理论基础上对线性分类器提出的一种机器学习方法。SVM的主要思想可以概括为两点:(1)它是针对线性可分情况进行分析,对于线性不可分的情况,通过使用非线性映射算法将低维输入空间线性不可分的样本转化为高维特征空间使其线性可分,从而使得高维特征空间采用线性算法对样本的非线性特征进行线性分析成为可能;(2)它基于结构风险最小化理论之上在特征空间中建构最优分割超平面,使得学习器得到全局最优化,并且在整个样本空间的期望风险以某个概率满足一定上界。
2.林产品贸易信息分类系统设计
2.1 林产品贸易信息分类系统流程
林产品贸易信息分类过程包含样本训练和分类两个阶段,两个阶段的共同之处是都需要对HTML页面进行预处理并对处理后的文本进行分词。训练时通过特征选择,生成特征向量,最后得到分类模型;分类时先生成特征向量,利用分类模型进行分类,最后得到分类结果[1]。
2.2 HTML解析
HTML文档中包含大量与林产品贸易信息无关的文本,因此在进行分类之前先要去掉与网页分类无关的html代码,将网页文本抽出。HTML文档中等标签中用来描述网页的表现形式,与网页的具体内容无关,因此可以直接去除。另外,在林产品贸易信息页面中,噪音信息多为导航和广告连接,通过去除HTML文档中的链接文字可以有效的去除网页中的噪音信息。
图1 分类流程设计
2.3 训练样本分词
分词的目的是将文档分割成一个个的单词。一般可以将所有样本的词都提取出来作为特征集,默认情况下,所有词的权重都是等同的。分词完成之后就要去除"停用词"了。所谓的"停用词"是那些没有意义的词语,他们对文本分类没有贡献,比如说各种标点符号,今后、今天、今年这样的词语等。去掉这些没有作用的词语可以减少文本特征集的元素数,从而减少不必要的运算量。本文中使用的分词工具为ICTCLAS。
2.4 生成特征向量
生成特征向量前首先要进行特征选择。特征选择是就是依据某种权重计算公式从词典中选择一些有代表性的词。常用的特征选择的方法有很多种,例如:Chi、Mutual Inform-ation、Information Gain和TF-IDF[2]。
本文利用TF-IDF方法进行特征选择。TF-IDF是一种统计方法,用以评估一个字或一个词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。特征项在文档中的权重可以根据公式(1)进行计算[4]。
(1)
其中tfi(d)为ti在文档d中出现的频率,N为文档集中的总文档数,nk为出现特征向量tk的次数。
2.5 生成分类模型
将文本转换为向量后,后面要做的工作就是利用SVM算法进行样本训练了。SVM算法本质是二类分类器,为解决多分类问题目前常采用的方法是one-against-rest[3]。本文使用Libsvm构建SVM分类器。Libsvm是一个简单、易于使用和快速有效的SVM分类工具。使用时直接输入训练样本,并配置相应参数,即可进行模型及预测。
3.实验及结果分析
本文从采集了10个类别共5000个网页,每个类别随机抽取3/5作为训练样本,余下的2/5作为测试集,如表1所示。
表1 实验数据
类别 训练集网页数 测试集网页数 网页总数 类别 训练集网页数 测试集网页数 网页总数
桦木 300 200 500 胶合板 300 200 500
松木 300 200 500 防火板 300 200 500
红木 300 200 500 纤维板 300 200 500
杨木 300 200 500 密度板 300 200 500
榆木 300 200 500 刨花板 300 200 500
本文中用于评估的两个指标分别是准确率(Precision)和召回率(Recall)。其数学定义如下:
准确率:;
召回率:,
其中,Np是分类器预测为C类的文档数,Nc是实际属于C类的文档数,Ncp是正确分类的文档数。
图2 实验结果分析
由图2可见P,R以及F值均较高,说明该方法在应用在林产品贸易Web信息分类时较为有效。
参考文献
[1]段军峰,黄维通,陆玉昌.中文网页分类研究与系统实现[J].计算机科学,2007,34(6):210-213.
[2]孙建涛,沈抖,陆玉昌,等.网页分类技术[J].清华大学学报:自然科学版,2004,44(1):65-68.
[3]许世明,武波,马翠,等.一种基于预分类的高效SVM中文网页分类器[J].计算机工程与应用,2010(1):125-128.
[4]王美方,刘培玉,朱振方.基于TFIDF的特征选择方法[J].计算机工程与设计,2008,28(23):5795-5796.
[5]陈剑.林产品贸易信息推送的文本信息过滤技术的研究[D].北京林业大学,2012.
基金项目:中央高校基本科研业务费专项基金资助项目“多元异构林产品信息推送平台研究与实践”(项目编号:BLYX200928)。
【关键词】信息;审核;分析;加工;存储共享
信息采集是信息内容和信息应用业务发展的基础,通过采集大量真实、有效的客户信息、供求信息、交易信息等,可以有效促进网络商务的发展,成功的网络商务交易,同样可以增强客户对信息的渴求,对网络的黏性,提升了信息采集的针对性、目的性,使采集的信息更准确、更具市场价值。因此,实施信息采集、发展网络商务,开辟并建立起直接面向客户与市场需求的信息采集渠道,建立健全信息采集、分类、审核、加工、的信息内容服务保障体系和网络商务运营体系,是企业价值极大提升的关键工作。
一、信息采集的组织架构
以客户为中心,利用渠道优势、客户资源优势,从省、市、县三级设立专职人员从事省级信源的规划、采集、审核、录入、加工、分析、、共享等工作。
二、信息采集的渠道
可通过客户经理、营业厅、农村信息服务站、社区、呼叫中心坐席、互联网、合作渠道、经纪人采集信息。
1.采集对象
所有产业活动的单位、个体经营户、乡镇企业,都是信息采集的目标客户,包括所有的在网客户与异网客户、所有的企业客户与农村客户。从需求上分为客户需求和市场需求两种:
客户需求为:客户主动各类信息(以供求信息为主)达到宣传自身或其产品的目的。采集对象的确定以客户意愿为准,只要客户的资质及其产品符合要求和规定,即可确定为采集对象。
市场需求为:客户对此信息有查询、搜索需求。采集对象的确定遵循以市场为导向,以客户为关注焦点的原则,即:通过分析公众客户对信息的需求程度和客户数量,达到公众客户总量的0.5%-1%,即可确定为采集对象。如公交信息、票务信息、天气预报、市场行情等。
2.采集内容
基本信息:企业名称、通信地址、联系人、联系电话、邮编等客户基础信息。
资质信息:各类专业资质、工商执照、税务登记证明等能够证明客户合法、合规和具备相关行业的资质证明等信息资料。
供求信息:企业供应或需求的各类产品及服务信息,如产品信息、企业LOGO、多媒体播放信息等。
3.信息分类标准
可依据国家统计局行业划分标准《国民经济行业分类》和相关编码规范,参考业界行业分类现状,结合通信行业特点,对比各业务平台分类情况,将行业分类标准统一。
4.信息采集标准
必须遵循及时性、准确性、有效性、系统性、适用性、完整性等标准。
5.信息标准要求
客户信息存放到数据库中,除企业名称、通信地址、联系人、联系电话、邮编等基本信息外,还包各类专业资质、工商执照、税务登记证明、产品信息、提供服务等资质信息、供求信息,除此之外都要有城市编码、分类代码,表明客户所在城市和行业分类。
三、信息内容的审核
设置初审和终审两级审核机制,审核信息内容的准确性、安全性、有效性、时效性、完整性,保证信息内容的合法性。
(一)审核规范
1.根据相关法律、法规,退回禁止销售和涉及侵权及假冒的信息;
2.审核所填资料的真实性,如有必要,需提供证明文件,如出现其他公司名称等情况;
3.审核信息和图片的相关性,不允许图文不符的信息;
4.审核信息是否为信息采集对象的内容;
5.审核信息是否在采集内容和信息分类范围内,不符合标准的信息应不在信息采集库中;
6.审核的信息分类是否正确;
7.判断产品是否含欺诈、伪造成份;
8.审核信息是否符合采集标准及要求。
(二)审核步骤
1.初步审核。由信息采集人员或各采集点专(兼)职审核人员对采集信息内容的权威性、真实性、准确性、时效性、安全性和信息在前台页面展现形式的合理性进行初步的审核。
2.最终审核。由专职信息审核员对录入的信息内容进行甄别、筛选、加工等,确保信息的权威性、真实性、准确性、时效性、安全性并提交(参照审核规范)。
3.对用户修改的信息进行初审和终审,遵循上述两个步骤。
(三)审核时限
信息初审要求0.5个工作日审核完毕,并在2小时内完成信息的录入。
信息的终审、环节要求及时审核上传的信息,信息处理时限为0.5个工作日内完成信息的终审与。
对于客户在网站上自主注册录入的信息,要求当日内处理且1小时内完成审核及信息。
由管理人员对通过审核的信息进行部分抽查,做到信息审核的精准性,同时也对相关人员进行监督检查。
四、信息内容的分析加工
对收集的信息进行梳理、研究并深度加工的过程,包括对信息整理研究结果的表达以及价值评价等,是信息广泛应用的基础和前提。
按内容分析,分析采集项的优先级、必要性、精准性;分类是否精准、信息是否可以兼容分类等;对采集对象、内容等的扩展研究分析,分析是否加上某些信息项、是否修改或去掉某些信息项。
按区域分析信息数量,区域内某一行业的信息数量。
按行业分析某一行业不同区域的信息数量。
按某信息项分析,如根据客户信息内容分析基本信息、供求信息等。
五、信息内容的存储、共享
信息的存储:分类、审核的信息加工、处理,归集到数据库中,便于各个业务平台的信息调用及应用。
信息的传递、:准确地客户信息,同时对重点关键的信息进行深挖掘和深加工,提取具有市场价值的信息,通过共享、互通的方式传递给其他系统、渠道和岗位,针对客户的需求开展信息的销售。
六、信息内容的应用
1.信息应用
通过对采集的数据进行集中和整合,统一标准和定义,形成数据信息资源库,做好信息安全、保密工作,同时共享给各平台提取所需数据。如:为黄页业务发展提供客户的基本信息,网络商务应用等。
2.信息评估
一、XBRL简介
可扩展商业报告语言,简称XBRL(ExtensibleBusinessReportingLanguage),是一种编制、公司财务报告和其他信息的标准化方法。实际上XBRL是一种平台式的数据描述语言,他通过一种编译来达到财务信息交流的目的,其实质是会计信息的一种读取方式。XBRL被广泛应用于财务报告、审计报告等方面,是现代财务信息管理的重要方法。
二、XBRL在会计信息标准化中的应用
XBRL是会计信息标准化的重要推动力和催化剂。由于XBRL的介入,会计信息标准化的步伐进一步加快,财务信息处理的速度和效率、质量都得到迅速的提高。
1、XBRL推动了内部控制标准化。会计信息标准化中的内部控制标准化指的是组织通过制定财务相关的规章制度以及防控方法及流程,防止和减少会计遗漏、营私舞弊等带来的财务失真,保证财务信息的真实性和资产的安全、准确。XBRL利用自身的标准化优势驱使组织按照其标准模式进行操作,使财务会计信息控制更加透明化,增加可控制性,减少因人为或主观因素导致的财务信息失真,进而控制财务信息的内部标准化。会计信息标准化的首要设计目标就是内部控制的标准化,其意义在于只有内部形成统一的控制标准才能真正实现财务信息的可对比性和对查阅性。XBRL利用标准化的控制体系要求组织按照其标准执行财务信息的标准统一控制,这在一定程度上来说使得组织内部控制标准化得以实现。组织实施XBRL在无形中推动了会计信息标准化的进程。
2、XBRL推动了会计流程和财务信息处理标准化。XBRL是一个完整的体系,它按照标准的流程来处理问题和实现财务信息的交换。而在会计信息标准化过程中,核心实现的是会计流程和财务信息处理的标准化。随着组织的不断扩大和会计信息标准化的不断加深,会计流程和财务信息处理的标准化逐步被提到议事日程上来,如何利用信息化手段实现会计流程和财务信息处理的标准化,有效防范会计风险成为一个重要的课题。XBRL在实施过程中利用自身标准化的优势,为会计流程和财务信息处理的标准化提供了便利。
首先,会计流程标准化和财务信息处理标准化需要完整的标准化数据交换作为支撑,XBRL作为一种基于信息化条件下实现的数据交换及解析工具,具备了提供这种支撑的条件。会计流程标准化其实是会计流程再造的一种形式,其本质在于在现代经济环境下实现会计流程的合理化和严谨化,规避会计流程风险;财务信息处理的标准化是在原有的帐务处理以及财务数据及信息交换基础上,转变非结构化财务信息的处理方式,逐步实现财务信息处理的规范化和标准化。XBRL利用自身规则要求会计流程和财务信息处理必须按照固定标准执行,这就在根本上约束了会计流程和财务信息处理的随意性。
其次,财务信息处理日益纷繁复杂,传统的信息处理方式已经无法满足各部门对于财务信息的需求。传统的财务信息处理难以实现共享,其他部门要使用还需要专门人员进行翻译。这就消耗了大量的人力和物力,并且在翻译的过程中由于种种原因不免产生误差和错误,这就造成了财务信息的失真。另外,财务信息在处理过程中,由于审批、传递环节往往需要经过不同的部门,各部门难以了解财务信息的真实意义,导致审批失效,达不到预期效果。因此,XBRL在财务信息处理过程中的应用也就显现的更加必要。将XBRL应用于财务信息处理可以规范化各类财务报表和财务信息,使各部门实现共享,有效避免在审批和传递环节出现的失真和脱节现场,实现财务信息的可重复利用性。
第三,非结构性财务信息的处理日益成为会计信息标准化的一大障碍,消除这一障碍将有效促进财务信息处理的标准化。合理利用XBRL,建立一整套的财务信息处理标准,利用标准化的处理方式来解决非结构性财务信息处理问题,将有利于非结构化财务信息处理的结构化处理,从而扫除财务信息处理标准化进程上的一大障碍,保障其顺利推进。
第四.财务信息处理注重提高财务信息,尤其是会计信息的质量,而这一质量的提高需要依靠信息化的现代信息技术。传统会计信息质量往往通过投入大量人员进行反复核算来实现,不仅浪费大量人力,还有可能造成会计信息的失真。XBRL作为信息交流的平台类语言,其可以使用统一的标准来约束会计行为,从根本上杜绝会计信息质量的失真。
3、XBRL促进财务信息分类汇总的标准化。财务信息纷繁复杂,尤其是在现代商业模式和经济运行水平下,财务信息的收集、整理和分析显得更加重要。财务信息的分类汇总使得财务信息应用更加方便,传统的汇总手段多采用纸质的档案形式,在现代信息条件下,网络和数据化存储成为主流,新的财务信息分类汇总方式要求新的标准化流程来操作。XBRL在操作过程中要求财务信息分类汇总标准化的出现,这在一定程度上促进了其标准化的过程。
关键词:知识管理 知识化监理 知识结构
信息工程监理是最近几年兴起的保障信息化建设质量的一种约束机制。它采用“五控两管一协调”的控制模式,对业主、承建单位的项目行为实施监督,保障信息化建设的质量,避免“豆腐渣”工程,起着不可或缺的重要作用。
一、信息化建设与知识管理
信息化建设是以知识管理为核心,信息资源为基础,提高组织核心竞争力为目的的全面整合或再造组织业务流程的过程。知识管理是获取、储存、学习、共享、创新知识的管理控制过程。在信息化建设中,企业、政府等组织通过知识管理,从现有的业务流程和数据中,挖掘、获取并确定各类知识资源,定位拥有专业知识、经验的个体,将个体的知识、经验、信息提升为组织的知识资源,有序传递、整合、规划和有效利用知识资源,有助于提高组织的整体业务、技术和管理水平。
在承建单位实施信息化建设中,知识管理是通过公司内雇员、部门、可能的跨国公司合作、与业主的沟通协调,传递、整合、有效利用本单位的知识资源,运用信息技术,通过设计最优技术方案、控制施工质量,共享和创造知识价值。
在信息化建设中,对组织内各种各类知识进行评估,挖掘、获取真正有用的知识。知识不仅仅是信息,是显性知识和隐性知识的集合。通过评估,区分知识和信息、知识管理和信息管理,以实现资源的充分开发与应用。
整合或再造业务流程,是与知识管理密切相关的。1990年美国管理专家Michael Hammer提出了“业务流程重组”(Business Process ReengineeringBPR)的概念,它是以用户需求为导向,信息化、知识化为基础,对用户的业务流程进行再思考、关键性的重新设计和根本的变革,从而获得在成本、质量、服务和速度等方面业绩的持续改善。在业务流程重组中,信息(知识)的获取、分类、存储、利用,只有与知识管理结合,才能够发挥更有效的作用。
知识管理技术贯穿于信息化建设始终,它与信息技术相辅相成。在知识获取、学习、共享、创新的过程中,整合各种信息技术,构建完整的知识管理体系,是知识经济时代信息技术的新发展。
二、信息资源规划和整合
信息资源整合(Information Resource Integrating, IRI)的前提是进行统一的信息资源规划(Information Resource Planning, IRP),消除“信息孤岛”,共享信息资源。信息资源的规划是实施信息化工程的基础,IRP的基础是建立信息资源管理基础标准,IRI的实质是通过信息技术改造、重建或重构数据环境。信息产业部的《信息系统工程监理暂行规定》中定义信息资源系统为“以信息技术为主要手段建立的信息资源采集、储存、处理的资源系统”。
在信息化建设中,信息资源规划是很重要的一环。在组织的生产、经营、服务活动中,会产生大量的数据、资料、指标、图纸、报表及其它显性资源,也存在各种各类的知识、拥有专业知识和经验的个体等隐性资源。信息资源规划是对实施信息化后产生、控制、使用这些资源进行识别和分类;评估、挖掘、获取、共享各类知识;对承载信息资源的信息基础设施进行分析、设计和指导。
(一)信息资源规划的主要任务
信息资源规划的任务是对支撑业务流程的逻辑相关的数据进行分类,建立具有结构化、标准化、一致性的共享数据库。分析业务流程重组后产生、控制和使用的数据,了解各种数据的内容、范围、可靠性等,理解数据的共享要求和应用策略以及数据使用中的问题,使信息资源规划能够满足数据资源的管理要求。
(二)信息资源管理标准
信息资源管理标准是指决定信息系统质量的、进行信息资源开发利用的基本标准。威廉·德雷尔1985年在其《数据管理》专著中总结了信息资源管理的基础标准———数据管理五项标准,内容如下:
1.数据元素标准。数据元素(Data Elements)是信息资源中最小的信息单位,是抽象的数据对象。它的质量是构建稳定的数据结构基础的关键。数据元素标准包括数据元素命名标准、标数据元素识标准和数据元素一致性标准。
2.信息分类编码标准。是信息标准中的基础标准。信息分类编码(Information Classifying and Coding)的对象,是一些最重要的数据元素,自动处理、检索、存储和传输信息的质量及效率与这些元素紧密相关。信息分类是根据信息内容的属性或特征,将信息按一定的原则和方法进行区分和归类,并建立一定的分类系统和排列顺序,便于管理和使用信息。信息编码就是在信息分类的基础上,将编码对象赋予有一定规律性的、易于计算机和人识别和处理的符号。信息分类编码工作要确定每个编码对象的编码规则、码表结构和代码表。
3.用户视图标准。用户视图(User View)是一些数据元素的集合,表示用户对信息需求和数据实体的最终解释。用户视图是数据的系统外在表现形式,是系统的输入、输出媒介和手段。用户视图与外部数据流是同一词,来自某个数据源或流向某个数据接收端的数据流。常用的用户视图有纸面的,如图纸、单证、表单、报表、账册等;有电子的,如屏幕格式等。
4.概念数据库标准。概念数据库(Conceptual Database)是用户对数据存储的最终解释。用户的信息需求,应首先界定概念数据库。概念数据库是综合信息资源用户的数据要求构成的全局数据库,表示数据库的整体数据组织状况和逻辑结构。
5.逻辑数据库标准。逻辑数据库(Logical Database)是系统分析设计人员的解释。在关系数据库模型中,逻辑数据库是一组规范化的基本表(Base Table),是从概念数据库中映射出的所需信息。逻辑数据库表示的是局部数据的数据库逻辑结构。
(三)信息资源规划方案
在定义数据管理标准的基础上,制定信息资源规划方案,为业务流程重组提供依据,为系统设计提供基础。
在信息资源规划中,将隐性资源转变为显性资源,有序传递、整合、规划和有效利用各类知识资源。因此,信息资源规划是资源的知识管理规划。信息技术的投资,可能不会给企业带来明显的效益,因为基于信息的竞争优势正在逐渐转变为基于知识管理的竞争优势,以信息资源规划为核心的信息系统规划,如果不实施知识管理,将不会产生显著的信息化效益。
(四)资源整合
资源整合是信息资源规划的关键。不仅仅信息整合,也包括各类显性、隐性知识的整合。如何在整合各类知识资源中创新,是信息资源规划的主要目的。在资源规划中,既要考虑信息化建设前期的知识挖掘、分类、整合;也要考虑信息化实施过程中形成的各类资源的收集、分类、整合,如何有序传递、有效利用;
还应考虑后信息化应用过程中将要形成的分散的、孤立的、相互关联的各类资源的整合。通过资源整合,实现资源最大可能的高度共享和有效利用,使内容和服务提升到新的高度,消灭大量存在的“信息孤岛”或“信息烟囱”,获得信息价值的最大化;使信息技术的投资获得增量,将潜在价值转变为企业发展的动力。
三、基于知识管理的信息工程监理
在信息化建设中,采用全面质量管理的思想。实施全面质量管理,是信息工程监理的控制目标。美国质量管理专家费根鲍姆(A. V. Fergenbaum)于20世纪60年代提出的全面质量管理思想,是随着科学技术的发展和经营管理的需要逐步发展起来的现代化质量管理学科。其深刻内涵已经远远超出一般意义的质量管理领域,而成为一种综合的、全面的经营管理方式和理念。
如何在信息化建设中实行全面质量管理,以保障信息系统工程的质量,是需要在实践中探索和研究的。信息化建设监理机制是保障信息系统工程质量的重要手段,“三控、二管、一协调”及知识产权保护和安全控制是监理的核心,也是在监理过程中实行全面质量管理的核心。
(一)全面质量管理的定义
全面质量管理在ISO 9000族标准中的定义为:“一个组织以质量为中心,以全员参与为基础,目的在于通过让顾客满意和本组织所有成员及社会受益而达到长期成功的管理途径”。在知识经济时代,这种管理应向知识管理延伸和发展。建立知识管理体系,是提高企业竞争力、推动企业发展的动力。实施全面质量管理就是建立质量控制的知识管理体系。
知识管理贯穿信息化建设的始终,在全面质量管理过程中得到体现。通过知识管理,帮助企业从已存在的信息中挖掘、分析、整合有用的知识,发现和创造新的知识,提升质量管理的质量。信息化的特征是技术和服务,在知识管理中实现创新是信息化发展的源动力。
(二)信息工程的知识化监理的内涵
信息工程的知识化监理,融合个人知识(经验、专业、技术等)积累和企业知识(记录、文档、文化等)积累,使质量管理不仅仅停留在文档化、参数化、流程化、制度化的作业中,而具有质的提高,促进个人知识和企业知识的相互转化。
在监理过程中,促成业主与承建方、业主与监理方、业主与业主、承建方与监理方之间的知识转移。在信息化建设中,由于业主缺乏相应的技术、知识、经验等准备,监理的介入可以帮助业主与承建方沟通,了解承建方的技术路线、设计思想、公司实力、技术服务和支持等;帮助业主与已实施信息化的企业交流,学习经验、吸取教训、规避风险;提供对承建方的评价、解决方案的评价、项目实施方法的评价、项目阶段和完成的评价以及技术服务和支持的评价等;提供风险管理、质量管理、进度管理、投资管理、安全管理、文档管理等相应知识。在这个过程中,完成了多样性、多方位、多层次的知识转移。
信息工程监理在信息化工程中,通过实施零缺陷、戴明环、6σ等全面质量管理方法和ISO9000质量管理体系标准,提高对质量、质量管理的认识,形成以知识管理为基础的质量管理作业流程,保证信息工程的质量。实现信息和知识资产的积累和保存,促进内部信息和知识的流通,达成组织内部知识的共享。
四、信息工程监理的知识结构
(一)信息工程监理的总体架构
信息工程监理的总体架构由5部分构成:⑴监理目标是信息系统工程总体目标和任务,包括五个阶段,即项目孵化、规划设计、项目实施、验收测试和运行维护;⑵监理范围,即监理职能×监理内容;⑶监理实施;⑷监理支撑;⑸系统评测。
(二)信息系统工程监理的知识结构
信息系统工程监理的知识结构,由5个维度的知识空间组成:
1.监理范围。这个知识维度是由监理职能和监理内容构成的一个矩阵。监理范围是信息系统工程监理知识结构的核心,其它知识元素都是以监理范围为中心,辐射信息系统工程整个生命周期。
信息系统工程监理包含7项职能:决策与领导、规划与设计、组织与人事、协调与沟通、控制与监督、投资、评测与创新。主要内容包括:质量控制、进度控制、投资控制、安全控制、知识产权控制、信息管理、合同管理、组织协调。
2.监理目标。与信息系统工程监理总体架构中监理目标是对应的。这个知识维度主要包含两个内容:
(1)信息系统工程的总目标。这个总目标因项目的不同而存在差异。信息系统工程监理根据不同项目的特点,协助用户在目标选择、制定中,考虑系统的前瞻性、实用性、先进性、可靠性、安全性、业务流程重组或再造等。监理的目标就是支持和保证这个总目标成功实现。
(2)信息系统工程的任务。信息系统工程的主要任务包括项目孵化、规划设计、项目实施、测试验收、运行维护等。监理的目标就是保证工程项目各个阶段任务目标、质量目标、进度目标、投资目标、安全目标、知识产权目标的顺利实现。
3.监理实施。在这个知识维度中,根据工程的特点、用户的需求、进度的安排、资金运用及相关条件等,并参照信息系统工程生命周期内的各个阶段划分监理实施各阶段。监理的实施一般分为4个阶段:前期准备、监理规划、过程控制、监理结束。但监理实施的阶段划分并不一定与信息系统工程生命周期各阶段有对应关系。
4.系统评测。这个知识维度强调信息系统工程生命周期中各个阶段的质量评价、风险评估、安全评测等。评测是在监理范围的知识维度内调控。
5.监理方法论。在监理范围内,根据项目特点,为实现监理目标采用的知识原理、方法、设施、工具、法律、法规、标准、规范等的集合,是实施监理的依据和手段。
信息系统工程监理知识结构一般是按照各个维度的知识展开,但5个维度的知识不是相互孤立的,它们之间相互渗透、相互融合。由此构成信息系统工程监理知识空间。
信息工程监理,是我国独特的项目管理约束机制。实施知识化监理,是项目管理的延伸和发展。监理单位应注重信息化过程中,在以信息资源规划为核心的信息化规划中展现的知识特点、知识结构和知识转移等,注重企业内部外部的知识积累和共享,用知识指导监理。实现监理过程的知识管理,极大提高信息工程的质量。
[参考文献]
[1]郎庆斌等.信息系统工程质量控制[M].人民出版社, 2005.7.