HI,欢迎来到好期刊网!

大数据视域下网络模型构建分析

时间:2023-05-04 10:39:03

导语:在大数据视域下网络模型构建分析的撰写旅程中,学习并吸收他人佳作的精髓是一条宝贵的路径,好期刊汇集了一篇优秀范文,愿这些内容能够启发您的创作灵感,引领您探索更多的创作可能。

大数据视域下网络模型构建分析

关键词:大数据;信息链;健康数据;网络健康信息;信息可信模型

2016年10月25日国务院发布《“健康中国2030冶规划纲要》,首次在国家层面提出健康领域中长期规划战略。国家高度重视推进健康中国建设,提高人民健康水平,提出加强健康大数据资源共享开放、推进网络健康可信体系建设、建立健康服务管理留痕可溯及健康数据安全运行的健康管理新模式。互联网技术的发展给网络健康信息传播提供良好的孕育空间,并将全民对健康信息的需求推向前所未有之境遇。然而,健康信息生态逐步恶化,主要表现为健康信息来源各异、健康信息庞杂冗余或虚假健康信息泛滥等,不利于用户对健康信息的采纳和应用,甚至产生更为严重的后果。因此,本文聚焦于网络健康信息可信性的研究,直面实践领域的实际诉求,对相关研究也有一定的促进作用。

1网络健康信息可信模型构建原则及目标

1.1构建原则

1.1.1系统性

网络健康信息可信中的要素包括网络用户、技术环境、健康信息等共同作用的整体,因此,在网络健康信息可信模型构建过程中,需要将网络用户的感知可信及健康数据技术可信进行区分,通过健康数据技术层信任的建构和网络用户感知层的信任建立以及健康数据三维架构作用下,健康数据技术层与健康信息感知层之间连接的基础。在大数据环境下,网络用户通过主观需求形成的健康信息搜寻行为及被动推送所实现的健康信息获取,从心理学角度可以理解为网络用户接收健康信息,会出现由认知到感知的过程,并由健康数据三维架构的多维度表征要素作用下影响网络用户感知可信。因此,大数据视域网络健康信息可信模型构建必须遵循系统性原则。

1.1.2科学性

在网络健康信息可信模型构建前及构建过程中需要遵循严格的科学研究方法。在对健康数据三维架构中的时间维度、空间维度及内容维进行指标选取过程中,采用扎根理论的方法挖掘出网络用户感知可信的健康数据三维架构各维度表征要素,并采用专家赋权的方法,对主要影响关系和次要影响关系进行区分。因为网络用户的情绪会影响对于健康信息的信任,所以在健康数据时间维度的健康数据溯源过程中,以其健康数据溯源过程中的特性实现去情绪化,使本文构建的网络健康信息可信理论模型具有合理性及客观性。

1.1.3层次性

在本部分构建的网络健康信息可信模型过程中应严格遵循层次性原则。对于网络健康信息可信在本研究中的界定,网络健康信息可信包括网络用户的感知可信和健康数据技术可信。此外在健康数据三维架构引入本研究中后,其多维度表征,例如时间维、空间维及内容维需要在理论模型中得以全面呈现。

1.1.4实用性

本部分构建的大数据视域下网络健康信息可信理论模型可以供相关数据管理人员、决策者及商业性质的网络健康信息公司作为提高健康信息可信性策略方面起到参考作用,因此本部分构建的理论模型需具有实用性。

1.2构建目标

1.2.1扩展数据三维架构概念,延展其在网络健康信息可信领域的应用场景

当前研究多聚焦于数据三维架构中的某一维度进行,缺乏整体的应用场景研究。本文将系统分析健康数据三维架构内在联系,分析健康数据三维架构在网络健康信息可信性中的应用。1.2.2以健康数据三维架构为基础构建网络健康信息可信理论模型丰富健康信息学理论体系本研究以健康数据技术层信任和网络用户感知层信任为基础,以健康数据三维架构作用模块及保障模块为主要框架构建网络健康可信理论模型。该模型揭示了健康数据技术层信任和网络用户健康信息感知层信任关系,数据三维架构的引入从时间、空间及内容维度全面揭示信任建立的要素表征,以此丰富健康信息学理论研究内容。

1.2.3完善健康信息可信性评估的影响指标体系

挖掘支撑网络健康信息可信的健康数据三维架构各维度要素表征,并采用专家打分赋权的方式对指标进行重要程度划分,完善网络健康信息可信性评估指标体系。1.2.4为健康信息网站、APP提供优化解决方案以往研究发现,网络健康信息网站或健康类APP存在网络健康信息时效性低、信息内容文本中错别字多、语句不通顺或是健康信息内容缺乏出处等众多问题,导致健康信息可靠性低的现象。相关健康信息网站可以对标本文的研究中涉及到的影响指标、结论及对策,进行健康数据层面的数据治理或数据管理方面的保障措施,打破健康数据壁垒,增大健康数据开放共享力度,突破医疗机构内健康信息茧房,确保健康数据在数据生命周期内具有较高价值,提高健康信息的内容质量,增强健康信息可信性,提升高质量网络健康信息资源利用率。

2网络健康信息可信模型构建的理论基础

2.1信息链

本文将传统网络健康信息层面的特征深入至数据层,所以本文选取信息链为理论指导诠释数据和信息的联系。信息链是情报学科内的一个重要理论,由事实—数据—信息—知识—情报/智能五个要素构成。随着当代技术的发展,在云计算、物联网、大数据以及人工智能技术加持下,信息链的理论越来越深刻。马费成[1]老师提出在新的环境下,由事实—数据—信息—知识—情报/智能这种原有的信息链逐级提炼的模式发生了转变,相关行业的研究者或从业者可以任意从信息链上的某个节点切入进行研究,从而直接挖掘出所需要的知识、情报或解决方案。图1所示为信息链挖掘过程。不断升华的过程,在这个过程中,对数据的萃取同样可以达到对知识及情报的提炼结果。信息是经过加工的数据,也可以解为信息是数据处理之后的结果。对于数据与信息间的关系,DIKW也存在一定的解释力。DIKW是将数据(Data)、信息(Information)、知识(Knowledge)、智慧(Wisdom)由低到高归集到一种金字塔式的层次结构下的一个基本模型。图2所示为DIKW金字塔、可以清楚的发现由数据—信息—知识—智慧的向上汲取过程。由对健康数据的积累形成健康信息,对健康数据中的各类医学分类数据进行更深层的分析,将不同分类下的健康数据元素进行积累、分类及重新组织可以显著提高健康信息的价值。

2.2理性行动理论

本研究应用理性行动理论(TheoryofReasonedAction,TRA)相关研究模型,实现健康数据层的技术信任建构过程。理性行动理论中包括初始信任模型和技术信任形成模型。初始信任模型中一共包括三个部分,分别为信任倾向、制度信任及最终的信任。其中信任倾向包括对人性的信仰,对人性的信仰包括能力、善意、正直及信任立场。信任意向包括整体信任意向和单个行为的主观信任意向,分别囊括信任倾向、制度信任及信任信念,信任信念包括能力信念及正直信念。理性行动理论可以为大数据视域下网络健康信息可信形成过程的分析奠定基础。图3所示为初始信任理论模型。在上述初始信任模型的基础之上,Li[2]等人在技术信任形成模型中,将信任的建构分为四个层面,分别为人格信任(PersonalityTrusting)、认知信任(Cogni鄄tiveTrusting)、计算信任(CalculativeTrusting)和制度信任(InstitutionalTrusting)。其中的人格信任是由人本身决定是否进行信任,是由信息使用者的阅历、经历及学识等共同决定;认知信任是信息使用者通过外界环境中可以学习、理解和吸收到的专业知识,并以此权衡自己所具有的这种信任态度是否成立,起到一个论据的作用;计算信任是指在技术引入后,带来的信任改变过程,在本文中是指通过相关技术方法进行健康数据处理最终获得的信任;制度信任是有关于信息使用者在内的信任。

2.3S-O-R及MOA理论

S-O-R(Stimulus-Organism-Response)理论是心理学领域中一个较为经典的理论。该理论认为行为意图并非外部刺激下的机械式反应,而是有机体主动获取刺激并进行加工的内在认知活动。S-O-R即“刺激—有机体—反应冶。由刺激引发,这种刺激既来自于用户身体内部的生理、心理因素,也来自于外在环境。刺激(S)作为个人行动的外在诱发因素,可能受到环境、产品等影响。有机体(O)是用户的内在心理评价,为个体认知或情感转变的过程。反应(R)是用户对外界刺激反应的结果;M-O-A理论由心理学的中基本概念组合而来,分为动机(Motivation)行为的推动力、能力(Ability)行为表现所必须的技能、机会(Opportunity)环境因素(语境和情境)。

3健康数据三维架构与网络健康信息可信性关系辨析

通过对相关理论分析发现,信任理论中所诠释的是网络用户心理层面与网络健康信息之间所建立的信任,网络用户期望在使用网络健康信息的过程中,可以获取到自己需要的健康信息内容,从而辅助网络用户做诊疗决策[3-4],可以解决健康相关问题[5],在使用健康信息过程中个人隐私是可以被保护的[6],并希望网络健康信息平台应具有可靠性及可信赖性[7],提供多样化的功能满足网络用户的使用[8]。对于网络健康信息平台而言,其搭建的意义除商业盈利之外,还是希望通过网络进行健康信息的传播及利用可以为全民健康做贡献,本质是以善意为基础的[9]。网络健康信息平台本身需要具有可靠性[10],可靠性是健康信息内容是真实可理解的、健康信息是可用的、系统平台功能是全面易操作的。健康数据三维架构是由健康数据时间、空间及内容三维组成,三维度一般表征为:时间维度的健康数据溯源是其基本概念,而对于健康数据溯源目的及价值,可以在一般数据溯源的目的及价值相关研究中发现,涉及“数据从哪来冶和“有哪些中间数据可以用来实现数据溯源冶等相关问题[11]。后来对数据溯源的内涵定义不断被拓展,数据溯源是与数据产生直接影响的源头数据,通过数据溯源是发现目标数据在源头数据库中的位置[12]。不仅要从其源头数据及演变过程,还需要更加具体的信息来保证目标数据的可重复使用[13]。再经过数据溯源不断迭代后主要有分为两层含义,第一层含义是将目标数据的溯源描述为导致其创建的一般过程,另一层含义是关注演变数据的原始数据来源[14]。实际上,数据溯源本质上是一种记录目标数据的演变路径及其注释的元数据[15]。健康数据三维架构时间维解决的是健康数据在其生命周期内的数据活动记录都可以被记录,支持证据链的作用,并且健康数据是否具有证明其自身论据的功能以及相关可信性评估指标等问题。健康数据空间维度一般表征为健康数据可关联,代表健康数据是否具有开放关联、开放共享的能力。健康数据内容维度一般表征为健康数据可理解,此处的可理解代表网络用户感知层面的可理解以及是否具有可以被计算机识别纠错的能力。在网络用户使用健康信息过程中,对于网络用户而言,网络用户的认知基础、感知控制、电子健康素养及网络用户对健康信息的需求均是网络用户本身在对健康信息可信性方面有关的要素。对于健康信息而言,健康信息是由健康数据进行分析处理后被网络用户所理解的,健康信息的来源、健康信息内容、健康信息质量、健康信息可读性及健康信息载体都是决定健康信息可信性的关键要素。此外,除网络用户及健康信息之外,还需要互联网、媒体及通信等多种技术在健康数据采集、处理、存储、传播及网络用户利用过程中易操作的问题进行保障。用户对健康信息来源以及传播途径的信任,与健康信息中的内容无关[16]。网络健康信息可信性是健康信息源被网络用户信任的程度及对健康信息内容质量的综合[17]。除了健康信息源是否具有权威性、专业性、吸引力及可信赖程度外,网络健康信息可信性还包括用户对健康信息感知质量及健康信息内容的描述是否具有精确性的主观判断[18],是网络用户主观所认为的接收到的健康信息是否值得信赖。网络用户自身的健康素养通常受制于其自身的学历、经验及见识等自身属性,与健康信息内容无关[19]。健康信息的来源作为可信性的重要指标直接影响网络健康信息的可信性。健康信息质量、健康信息源可信性及网络健康信息可读性是影响健康信息可信性的重要因素[20]。另一方面“网络健康信息可信性冶指的是健康信息的特征,例如健康信息来源权威性、传播途径[21]及健康信息质量中涉及到的健康信息客观性、相关性、完整性、一致性[22]等。综上所述,“可信冶一概念由于在不同学科中扮演的角色不同,而没有相对统一的概念。但总体大致可以分为两类。第一类为以健康信息为对象,由健康信息本身及与之相关联的属性。第二类是以人为对象,网络健康信息可信性取决于信息使用者究竟是否选择信任。以上论据为基础,结合本文的实际应用场景,提出图4所示为支撑网络健康信息可信的健康数据三维架构。通过图4可以发现,在健康数据的时间维度实现对数据来源、数据产生及生命周期内的活动、数据加工过程中的活动进行全程跟踪记录,使其具有证据链的功能。在空间维度通过数据关联及数据空间等相关信息技术,有效解决健康数据不一致、同一主题下多种不同观点的分歧问题。在数据内容维度解决健康信息术语规范、语言逻辑不同及不可理解的语句错误等问题。最终通过数据时间、空间及内容维度共同作用下实现健康数据可信。所提及的健康数据三维架构下的作用价值代表健康数据可信、可控及可用,需要明确一个前提,即“健康数据可信未必健康信息可信冶,因为在进行健康数据分析的过程中,还存在主观的外界因素导致的数据分析结果解读出现偏差。

4健康数据三维架构作用路径分析

为进一步探究网络健康信息可信的健康数据三维架构各维度表征方式及健康数据三维建构整体是以何种方式作用于网络健康信息可信性,在该研究主题下的其他相关研究中[23],通过质性分析方法中的扎根理论方法,选取了20位网络健康信息用户进行半结构化访谈,以编码的形式进行主范畴以及相关关系的提取,并采用构建结构方程的方法进行检验,发现健康数据三维架构作用关系:淤作用关系1为健康数据三维架构寅健康信息感知可信。健康数据三维架构的表征共同正向影响网络健康信息用户的感知可信,健康数据三维架构三维度表征在上文中已经提及,由健康数据三维架构中的各维度表征其中包括时间维度健康数据可溯源、空间维度健康数据可关联及内容维度健康数据可理解,与其三者之间的关系,以此促使网络健康信息用户感觉到健康信息可信;于作用路径2为健康数据三维架构寅健康信息来源寅健康信息可读性寅健康信息感知可信。健康数据三维架构通过影响健康信息来源影响健康信息可读性,进而正向影响网络健康信息用户感知可信;盂作用关系3为健康数据三维架构寅健康信息来源寅健康信息质量寅健康信息感知可信。健康数据三维架构通过影响健康信息来源影响健康信息质量,进而实现对网络健康信息用户感知可信正向影响;榆作用关系4为健康数据三维架构寅健康信息来源寅健康信息可读性寅健康信息质量寅健康信息感知可信。健康数据三维架构对健康信息来源产生正向影响,进而对健康信息可读性并对健康信息质量产生影响,最终对网络健康信息用户的感知可信产生正向影响关系。虞作用关系5为健康信息三维架构寅健康信息质量寅健康信息感知可信。健康信息三维架构对健康信息质量产生正向影响,通过对健康信息质量的作用关系,进而对网络健康信息用户的感知可信产生正向影响关系。通过以上的研究,将网络健康信息可信的健康数据三维表征提取出来并且系统分析健康数据三维架构与网络健康信息可信性的影响关系,但并没有对其进行区分,为了本文构建的网络健康信息可信理论模型具有更强的解释力,因此,采用专家赋权的方法,对健康数据层面的影响因素进行赋权,表1所示,自上而下分别为健康数据时间层、空间层及健康数据内容层。可以发现网络健康信息可信的健康数据三维架构中的各维度所有指标重要程度中,主要影响指标为:治愈案例

5网络健康信息可信模型构建过程

在经过以上的网络健康信息可信过程、可信要素分析及健康数据三维架构在支撑网络健康信息可信各维度表征、影响指标赋权过程分析后,构建图5所示的大数据视域下网络健康信息可信理论模型一共分为三层四个模块。总体按照由数据层到信息层自下而上的层次进行分别阐释。

5.1健康数据技术信任层

健康数据技术信任层包括主观信任建构和客观技术支撑。主观信任建构部分包括人格信任基础和认知信任基础。人格信任基础中的网络健康信息用户的性格、能力及习惯等网络用户的自身属性。认知信任基础中包括网络健康信息用户的以往知识、过往印象及感知控制等。大数据背景下,由各种新兴技术应用推动的健康信息服务方式的改变,促使网络用户对健康信息的主动搜寻模式也在向被动推送模式进行转变。这种健康信息利用模式的转变,对于健康数据而言,在健康数据溯源、健康数据空间、健康数据关联及语义技术推动下,所实现的各种疾病医学数据库的构建、医学数据库中的术语规范、医学本体构建及关于健康数据的共享机制的建立,将网络用户原本认知信任基础包括以往知识、过往印象及感知控制等向感知信任进行转变;由以往人格信任基础包括网络用户的性格、能力及生活习惯等,向健康数据技术信任进行转变。健康数据技术信任层中的客观技术支持部分,营造了网络用户与健康数据整体信任的基础情境。其中,安全保障是在网络用户使用健康信息过程中,网络用户与健康数据整体的安全保障及制度信任,包括隐私性及安全性等。制度信任基础包括健康数据相关机构的管理结构及健康数据使用环境等。安全保障和制度信任是由网络用户与健康数据共同组成整体的信任建构。

5.2健康数据生命周期内保障层

为保障健康数据三维架构的实现,在对健康数据生命周期保障模块中分别从对健康数据的产生、获取、存储、共享、维护、应用及消亡生命周期的每个阶段里,对可能引发的健康数据质量问题进行识别、度量、监控及预警等一系列管理活动。在健康数据获取环节要对健康数据进行全面收集。在健康数据传输环节中,针对涉及安全技术层次最高的医疗健康数据进行加密传输或全信道传输,从而保障传输过程的保密性,传输中可采用哈希算法保护健康数据的完整性,减小健康数据被篡改的风险。在健康数据保存环节中,针对敏感的健康数据需要选择足够安全的加密算法进行加密保存,建立完全可控的暂时保存条件,以此减小健康数据泄漏风险。目前医疗健康大数据存储使用传统的隐私防护方式,由于其体量庞大且成长速度迅猛大多借助云端平台实现储存。在健康数据使用环节,应设立合理的脱敏制度。在健康数据销毁环节,需按照医学数据分级分类程度设置适当的销毁手段。除了健康数据层面的保障措施外,还应包括对组织进行改善,包括确立改进目标,评估组织流程、指定组织流程和改善计划、指定组织监督审核机制、实施改进、评估改善效果等多个环节。宏观方面要加强政府对互联网健康信息的监管工作,建立管理互联网健康信息的统一规范流程并规范各类网站开发流程,以社会大众需求为导向,积极推动互联网健康数据的集成和共享。

5.3健康数据三维架构作用模块

在网络用户与健康数据组成的信任整体中,通过健康数据三维架构的引入,将网络用户感知信任与健康数据技术信任进行关联。健康数据三维架构以其时间、空间及内容三维度要素表征影响健康信息来源、健康信息质量及健康信息可读性,并以24个影响指标对网络用户感知可信进行影响。对于网络用户而言,网络用户感知层的信任建立基础是网络用户可以理解的,进而产生由感知到认知的心理变化,是信息。而对于健康数据技术信任层而言,仍是数据。可以发现,通过健康数据三维架构的作用,将网络用户与健康数据的信任进行结合,搭建了健康数据与网络用户(健康信息使用者)之间的联系并形成信任整体,使本研究深入到健康数据层面。

5.4网络健康信息用户感知信任层

网络用户感知信任过程分为刺激、有机体及反应三个阶段。刺激阶段分为机会、能力及动机。在网络用户主动或被动接收健康信息的过程中,网络健康信息本身作为一种动机与健康信息系统、健康信息利用环境整体作为刺激(S),进而网络用户进行有机体(O)阶段的心理加工,实现反馈(R)阶段用户对网络健康信息是否信任。刺激(S)基于M-O-A理论抽取要素,包括动机(M)、机会(O)及能力(A)要素。动机(M)包括内因个性及外因环境,内因是一种诱发变量,强调用户本身。网络健康信息认知基础、思考问题方式及感知控制等均会导致其是否对健康信息产生信任,感知控制部分通过网络用户感知有用性及感知易用性进而决定网络用户的态度。外因环境受外部环境所影响,通常情况下,网络用户在主动及被动使用健康信息过程中,外部环境包括对治疗方案或手段的迫切需求,期望可以通过健康信息解决健康问题,获取疾病治疗手段或方法,进而刺激网络用户持续产生健康信息搜索行为并迫切地需要对健康信息产生信任;机会(O)包括健康信息质量、健康信息来源、健康信息可读性、健康信息载体及技术环境。健康信息质量是一个较为复杂的概念,在本研究中,实际场景是网络用户使用健康信息的过程中,因此,健康信息质量是对网络用户所处环境、情绪的适用性及满足网络用户对疾病诊疗或养身保健相关特定需求的程度,是网络用户实际感受到的收获或体验。健康信息载体在当今互联网时代较多以网络形式进行传播。健康信息来源是产生或携带信息的实体,借助在线技术所实现的网络用户健康信息的获取,来自政府和非商业网站的健康信息被认为具有更高的可信度,例如国家级权威健康信息网站,对于商业网站或包含商业广告的网站,网络用户倾向于认为这些信息可信性较低。技术环境是指在网络用户使用健康信息的过程中,所涉及到的所有技术渠道和技术支持,例如网络健康信息系统的搭建、网站整体运行速度、内容呈现速度或健康知识导航等方面,如果可以高效满足网络用户的健康信息利用需求,那么将快速产生信任态度;能力(A)要素包括电子健康素养。电子健康素养代表网络用户能够获得、处理及理解并做出适当健康决策时,所具备的基本健康信息接受程度,分为传统素养、媒体素养、信息素养、计算机素养、科学素养及健康素养六方面。电子健康素养能力会影响网络用户信息活动能力,并影响信任。在经过以上刺激和有机体心理加工阶段,并对健康风险进行评估后,实现的网络用户信任。消极的风险认知态度会降低信任,积极的风险认知态度可以使网络健康信息用户心情趋于平稳,并实现信任。可以发现在引入健康数据三维架构后,健康数据三维架构通过影响健康信息来源、可读性及健康信息质量对网络用户感知可信产生影响。健康信息质量与健康信息可读性作为一种动机被网络用户理解及接收后,在心里层面进行健康风险判断及实现最终信任。健康数据由于其复杂的特性使网络用户不能全部理解,这解释了上文中提及的网络用户个体的认知水平或电子健康素养不同所带来的差异。健康数据如果被网络用户所理解,即成为健康信息。对于不能够理解并赋予健康数据意义的网络用户而言,健康数据仍然是无任何意义的符号,同时也解释了上文中分析结果中健康数据三维架构分别以直接或间接的方式对网络用户感知可信产生影响。

6结语

信任既是经济交易的基础,也是社会关系的粘合剂[24]。大数据时代的来临,伴随着新一代技术的发展,传统的社会信任模式面临严峻挑战。大数据环境所呈现出的4V特征,扩展了网络健康可信的内涵和过程。本文对网络健康信息可信全面解析的前提下,明确了网络健康信息可信建立的基本过程,分析可信要素,提出支撑网络健康信息可信的健康数据三维架构,并构建大数据视域下网络健康信息可信理论模型,对网络健康信息可信性的研究聚焦于健康数据层面。将网络用户与健康数据作为整体信任进行分析,为后续健康数据溯源、数据空间及数据关联等技术应用于健康信息可信保障提供引导,为后续数据三维架构的多场景应用奠定基础。

参考文献

[1]马费成.在改变中探索和创新[J].情报科学,2018,36(1):3-4.

[11]刘海鸥,何旭涛,李凯,高悦.区块链数据溯源机制研究综述[J].情报杂志,2022,41(7):100-106+40.

[15]乔蕊,曹琰,王清贤.基于联盟链的物联网动态数据溯源机制[J].软件学报,2019,30(6):1614-1631.

[20]李月琳,张秀,王姗姗.社交媒体健康信息质量研究:基于真伪健康信息特征的分析[J].情报学报,2018,37(3):294-304.

[21]查先进,张晋朝,严亚兰.微博环境下用户学术信息搜寻行为影响因素研究———信息质量和信源可信度双路径视角[J].中国图书馆学报,2015,41(3):71-86.

作者:初彦伯 王萍 单位:吉林大学商学与管理学院