时间:2023-08-03 16:45:23
导语:在社交媒体文本分析的撰写旅程中,学习并吸收他人佳作的精髓是一条宝贵的路径,好期刊汇集了九篇优秀范文,愿这些内容能够启发您的创作灵感,引领您探索更多的创作可能。
【关键字】 微博 网络爬虫 情感识别 情感分类 支持向量机
引言
随着web2.0的快速发展,社交网络逐渐从各个方面影响着中国网民。微博成为了社交网络中社交工具的典型代表。网民使用微博在互联网上的活动主要是获取信息与信息,的信息含有自己对某事物的看法、观点、感知等个人情感。
它们主要以文字,表情符号(新浪微博默认表情及标点符号)形式出现。通过用户之间的互动传播(一个微博用户具有双重角色,即博主与粉丝),这种社交网络媒体具有传播速度快,传播范围广等特点。因此对微博情感识别与分类就显得尤为重要。
对微博文本的情感进行识别与分类,不仅能让企业及时了解客户需求寻找到潜在的客户群体,通过实时、准确地评估其情感。能够获得客户市场反馈信息及客户的消费习惯,帮助企业进行有效的需求管理及企业战略调整,从而快速应对市场变化,提高企业竞争力。还能帮助政府部门实时监控民众情绪,对负面情绪及时采取措施,防止不法分子企图通过微博平台传播谣言,以此保证社会的和谐稳定,政府了解民意,为制订国家政策提供参考。
同时也能协助医生分析心理障碍者,及时掌握患者情绪波动,准确对患者病情进行有效的对症下药。避免了患者不能准确描述病情,而带来的不相关治疗。
因此对微博情感进行研究具有重要的理论与实践意义。文章意在为政府或企业等利用到微博情感分析数据的领域提供基础。
鉴于自主采用Java语言开发的新浪微博的情感识别与分类系统,对中文微博的情感进行识别与分类研究。系统使用爬虫技术[1],抓取微博的文本内容,然后进行分词,去停用词,文本规范等预处理操作,再抽取情感特征,对文本情感识别与分类,最终输出分类结果。
一、相关工作
1.1文本获取及预处理
对微博数据资源的获取有两种形式,一种是用户以普通文本形式直接在系统前台相应位置输入待分析的文本,系统可以自动进行情感识别与分类;另一种是用户以微博文本URL形式输入,系统对用户输入URL连接采用网络爬虫技术抓取微博正文内容。
网络爬虫结构先将用户输入URL作为爬虫起点,通过web协议(主要是HTTP协议)采集页面,使用多线程或并列技术获取网页数据信息,网络爬虫结构也提供了链接过滤模块(过滤掉不符合URL规范的链接),页面数据库模板(存储已经爬取到本地的原始页面数据,以备预处理阶段建立索引使用)。
为了提高分类的准确率,减少获取文本内容不必要干扰,对文本进行预处理操作十分必要。系统的预处理操作主要包括:
1.文本规范化处理,判断待处理的文本是否含有由两个#组成的话题标签,若有则删除两个#及它们之间的文字内容。
2.使用正则表达式判断微博文本是否含有以下三种含@微博标签,若有将它们删除①以@开头,以:结尾②以@开头,以空格结尾③以回复@开头以:结尾。
3.判断英文词语是否含有感彩,删除不必要的英文词语。
4.用中文描述替代含有感情的“?”和“!”去除一些标点符号。
5.使用得到普遍认可的支持Java开发语言的ICTCLAS分词工具分词,去除停用词。
1.2文本特征抽取
文本特征抽取[2-3]是从文本中选取一部分能够反应其内容信息的特征词汇并计算其特征权重。特征抽取的主要目的是为了降低向量空间的维度,消除无关特征的噪音,通过选择可区分性强的少量特征来提高分类器的分类精度和效率。常用的特征选取方法有: 文档频率、信息增益法、期望交叉熵等。文档频率[4](Document Frequency )一种简单的特征约减技术,常用自动特征选择,通过设置目标特征的文档频率阈值来进行特征的抽取。DF是含有该目标特征的文档数与所有文档数的比值,可表示为
信息增益法[5]是指文本包含该特征项与不包含该特征项时的信息熵的差值,根据所获信息增益的多少筛选有效特征,已成为机器学习领域应用较为广泛的特征选择方法。信息增益法计算公式可以表示为:
由于当特征数目较少时,使用该方法得到的数据稀疏,分类结果会不理想,因此本文首先对预处理后待分析的文本里出现的每个词计算其信息增益,设置一个阈值,抽取特征词,按照信息增益值降序选择特征项组成特征向量。
期望交叉熵[6](Expected Cross Entropy)反应了文本类别的概率分布与在出现了某个词条的情况下文本类别的概率分布之间的距离。
词条的交叉熵越大,对文本类别分布影响也就越大。所以选CE最大的K个词条作为最终的特征项。
期望交叉熵计算公式:
为了提供特征词抽取的时间效率,针对微博的数据量很大的特点,使用期望交叉熵和TF-IDF求方差的方法抽取情感特征词。
1.3文本情感识别与分类
采用基于朴素贝叶斯主客观句识别方法[7]和支持向量机的分类方法[8-11]对文本分类。朴素贝叶斯方法是一种基于事件概率简单而误差率较小的分类方法。基本原理是:在事件相对独立的条件下,事件A在事件B发生的条件下的概率且与事件B在事件A发生的条件下概率是不相同的。及文档A属于B i类概率表示为
系统应用思想:对有已知类别集合S(x1,x2,…,xn),求在待分类项出现的条件下,集合中各个类别出现的概率,哪个类别的概率值大,就认为待分类项属于那一类别。并将对每个特征项主客观句的条件概率计算结果输出,作为支持向量机分类器的输入值。
系统的工作流程图如图1所示。
二、实验分析
使用第二届自然语言处理与中文计算机会议所提供包含4000条已经标注是否含有情感色彩的中文微博语料,含有13252个句子,且主观句中又表明了所属具体情感类。情感类别分为7个类别,分别是:喜好、安乐、惊奇、厌恶、悲哀、愤恨和恐惧。
选择这些数据作为系统测评数据主要是与系统测试结果进行比较,核实评价实验结果的召回率(R),准确率(P),性能评价指标F值。求解公式如下所示:
系统将实验测评数据首先进行预处理,对其进行规范化、分词去除停用词、抽取情感特征,然后采用朴素贝叶斯方法,使用其公式计算结果来识别主观句,支持向量机方法先将抽取的特征词转换成向量形式,再将向量化后的文本放到向量机的模型中,最终输出分类结果。通过计算支持向量机的情感分类方法召回率达到74.4%,准确率高达63.76%,F值达到0.6534.
实验中采用准确率,召回率,F值测评指标,对常见的情感特征抽取方法[16]实验结果进行了对比,见表1,通过对比朴素贝叶斯和支持向量分类方法对主客观句的识别结果,得出结论:本实验中对主客观句的识别朴素贝叶斯方法比支持向量机方法的实验结果更好。因为支持向量机方法准确率虽更高,但召回率较低。
实验结果见表2。对已识别的主客观句,我们采用支持向量机的一对一的多步分类方法及一对其余的一次分类方法进行情感分类。
实验结果见表3。实验结果表明:一对一多步情感分类方法效果优于一对其余一次分类。因为一对其余分类方法可能出现重叠现象或因不可分类现象而引起数据集的抖动。因此实验最终选择支持向量机的一对一多步分类方法。
三、结语
微博作为网民在互联网主要活动之一,逐渐从各个方面影响着人们,网民带有情感的言论对各行各业都有着不可估量的使用价值。因而对微博文本的数据分析研究有一定的社会意义。
通过查阅文献发现基于朴素贝叶斯识别主客观句的方法及基于机器学习支持向量的方法有较高的精度。而由于针对中文微博的研究大部分是理论性的研究,因此本文通过构建系统,将基于朴素贝叶斯的识别主客观句个方法及支持向量机的方法的研究思路实践化。实验结果对企业、政府及广大网民均有重要的社会意义。
展望:
1.后期会打破仅在初步解决微博文本的情感识别和分类问题的研究,接下来会投入对用户的图片信息,链接的视频声音信息进行研究。
2.本文去除英文词语,采用的是人工标注方法。鉴于部分国人倾向于有使用英文的习惯,所以会不断的完善系统情感库,或设计系统能自动翻译,以此减少人工工作量。
参 考 文 献
[1] YANG Yuekui,DU Yajun,HAI Yufeng,et al.A topic-specific web crawler with web page hierarchy based on HTML Dom-Tree[A],Asia Paciic Conference on Information Processing (APCIP 2009)[C].Washington DC:IEEE Computer Society,2009:420-423.
[2] 张彪.基于关联分析的文本分类特征选择算法[J].计算机工程.2010(22):184-186.
[3]谢丽星,周明,孙茂松.基于层次结构的多策略中文微博情感分析和特征抽取[J].中文信息学报,2011,26(1):73-83.
[4] Dai Liuling,Huang Heyan,Chen Zhaoxiong.A Comparative Study on Feature Selection in Chinese Text Categorization[J].Journal of Chinese Information Processing,2004,18(1)26-32.
[5] 李海瑞.基于信息增益和信息熵的特征词权重计算研究[D].重庆大学,2012.
[6] 廖一星.文本分类及其特征降维研究[D].浙江大学.2012
[7] 蒋良孝.朴素贝叶斯分类器及其改进算法研究[D].中国地质大学,2009
[8]杨鼎,阳爱民.一种基于情感词典和朴素贝叶斯的中文文本情感分类方法 [J].计算机应用研究,2010,27(10):3737-3739
[9]A.Basu,C.Watters,M.Shepherd.Support Vector Machines for Text Categorization.Proceedings of the 36 th Hawaii International Conference on System Sciences,2003.
[10]赵晖.支持向量机分类方法及其在文本分类中的应用研究[D].大连理工大学,2006.
[11]张博.基于SVM的中文观点句抽取.[D].北京.北京邮电大学,2011
[12]Youngjoong ko,Pjinwoo Park,Pjungyun Seo.Automatic Text CategorizationusingtheImportanceofSentence s[A].Proceedingofthe19thinternationalconferenceonComputationlinguistics[C],Taipei,Taiwan,2002:1-7.
[13] 韩忠明,张玉莎,张慧,等.有效的中文微博短文本倾向性分类算法[J].计算机应用与软件,2012,29(10):89-93.
[14] 张艳辉,杜文韬,刘培玉,等.基于词典的微博的倾向性分析[C].第五届中文倾向性分析评测研讨会,2013:50-52.
【关键词】数据可视化;大数据;商业智能;数据挖掘
1.时代背景
自21世纪以来,数据爆炸已是人类的重大挑战,人们淹没在数据海洋中,却对信息,知识极其缺乏,人类分析数据的能力与获取数据的能力相差甚远。同时,数据的多态、高维、获取的动态性、数据关系的异构更增加了数据使用的难度。在传统企业占据主流地位的关系型数据库有越来越多无法进行管理的数据。这类数据的量巨大,具有多样性,如各类文本、图像、视频、传感器信息,且数据产生和更新的频率上升到一个新层次。总结下即为海量化(Volume),多样化(Variety),快速化(Velocity),这三点为大数据的主要特征。人们要从海量非结构化数据中挖掘有用信息的这种推力,使大数据技术正逐步代替传统信息管理技术。伴随着推力巨大的互联网,大数据时代的大幕正逐步拉起。而在这发展过程中,能有效呈现多元化数据, 便于决策的数据可视化便越来越引起关注。
2.数据可视化的作用
在信息科学与知识管理中,DIKW(Data,Information,Knowledge,Wisdom)体系作为最基础的模型,在数据处理流程中完成从数据到智慧的转化。人们急切的需要能展示演绎数据的工具,并且能够传达数据身后真正的知识与智慧的工具。在整个转化过程中,可视化于沟通,传递,表达方面表现出明显的优势。
数据可视化运用计算机图形学,图像处理等技术,并以其在视觉感知与人脑认知上的优势使美学因素融合在数据分析中。优秀的数据信息图甚至可以达到艺术的层面,令人赏心悦目。其在数据处理流程中持续的优势,使数据可视化交互工具市场逐步做大。
数据就是石油,传统的各类领域中不被重视的数据重新归纳总结会释放出巨大潜力。新闻中的数据信息可以归纳为信息图表,再与其他新闻进行分析整合,人们往往可以从中有收获。政府机关的数据通过有效整理并进行可视化,可以增加其透明度,民众可以更容易获取有效信息。企业数据可视化,可以对整个企业运营流程有很好的掌控,便于管理与盈利。网络数据及公共资源的潜在价值也极大,各类社交网站开放的API可以供开发研究人员挖掘人们生活消费习惯,甚至可以通过文本分析并进行可视化发现流行病的爆发趋势,购物网站对用户已购货物记录进行地域偏好分析,也可获得有价值的情报。
3.主要应用
3.1 文本可视化
将文本信息提取技术与可视化相结合的文本可视化可以辅助用户将文本中的信息简洁地呈现出来。原始文本经过文本信息挖掘,视图绘制和人机交互,这便是基本的可视化流程。在诸多网站上,文本可视化的标签云技术已越来越常见,其为基于关键词的最简单的文本可视化技术,用颜色和字体的大小体现关键词于文本中的分布差异,衍生的Wordle技术改进了空间布局,提升了美学效果。在进行信息检索时,也可以使用TileBar,Sparkler等可视化方法来提升检索效果。除此之外,文本信息中还包含了大量的人类主观信息,可以在RSS新闻内容,社交平台中挖掘用户情感倾向信息,帮助调查者从宏观角度进行分析并为决策提供依据。
3.2 多媒体数据可视化
大数据时代,人们早已对半结构化数据及非结构化数据充满了好奇。图像,视频,音频中的数据价值推动了多媒体数据的可视化。比如社交照片中群体成员之间的关联多使用了海赛图方法;视频的可视化则经常使用将图像堆叠成立方的方法,为抽取视频中的运动信息提供方便;音乐的可视化如今也多是媒体播放工具的一个功能。
3.3 商业智能的数据可视化
如今的大量在线商业数据具有强烈的跨媒体特征与丰富的时空地理属性,用户的消费日志包含了大量个人信息,这些都催生了该领域的可视化发展。当前商业智能的数据分析大多借助于OLAP的多维分析模式实现,采用可视化技术进行数据探索。从最早的柱状图、饼图、网状图等简单图表,发展到呈现公司状态与商业环境的仪表盘、子弹图,新成长的技术能有效地传达数据背后的知识和思想。同时随着Tableau,Spotfire等软件的推广,可视化极大推动商业智能的大众化,降低了普通人进行数据分析的门槛。
3.4 Web端可视化
Web端的可视化是通过HTML,CSS,Javas-cript技术,在网页上实现可交互的可视化作品及时全面显示信息。Web端的可视化可以提升用户效率,使选择操作更加方便,感官更加舒服。D3.js就是一套面向Web的数据可视化的Javascript库,具有极大的设计灵活性和可移植性。国内开发的DataV.js同样出色,可以便捷的调用且兼容各类浏览器。
4.数据可视化的注意点
可视化虽然是非常好的了解数据的方式,不过也很容易以错误的方式执行从而背离了其价值所在。为充分展示信息而不顾图表的整体协调,想要包含更多的信息效果却适得其反,这样做很容易使图表缺乏美感。有限的仪表盘空间要包含的是重要的且值得优先考虑的数据,且当图表显示过多的信息时,过于紧密的布局很容易显示出错误的信息。而另一种错误则是为了追求画面的美观,却使数据内容的表达不佳。所以在可视化的过程中,目标的确立是最为基本的,专注于自己的目标有助于更好地传递表达数据,同时与图表的美观之间也能达到一种平衡。
真实的数据往往需要占用大量时间进行规范化,特征选择,维归约等预处理操作,数据集的清洗与规范化或许是实践中占最多时间的部分,此点不容忽视。同时,数据可视化是一种辅助分析的工具,非分析工具,正常的处理流程还要借助传统的统计手段及其他专业的知识。总而言之,数据可视化作为一种对数据信息进行专业化处理的优秀工具,其理论与技术将在未来获得逐步提升,最终一定会对商业社会及科研领域的发展作出重大贡献。
参考文献
[1]涂子沛.正在到来的数据革命:大数据[M].桂林:广西师范大学出版社,2012.
“110米栏是综合考验人体极限的一项运动,不仅是刘翔,曾经卫冕冠军的罗伯斯、阿兰·约翰逊、马克·麦克科伊都在男子110米栏项目中一个接一个地出现‘意外’。这些‘意外’的背后,只不过是退赛前的共同规律罢了。”
一手打造网络体育社区,一手出品足球电视节目的“欢呼吧”创始人兼CEO陈昊认为,用“足球魔方”的文本分析和数据挖掘技术,足以将各种体育现象背后的实质提炼出来。
给你好看的体育
陈昊把与查立的认识归结为一种“缘分”。在一场起点创业营举办的派对中,不同于那些不断向查立演说项目方案的创业者,陈昊更多的只是静静站在一边旁听,甚至忍不住开口帮助查立回答一些创业的基础问题。虽然与查立之间的交流很少,但仅仅这样的一次会面,却让查立记住了他,也邀请他入驻了起点创业营。
当时,陈昊正在进行一个互联网媒体项目,欲从传统电视媒体对于足球赛事转播的主流中另辟蹊径,摆脱频道资源和转播费用的束缚,建成一个体育新闻和数据的社交分享源和体育垂直社区(这就是后来的“欢呼吧”),以及包含全球大量比赛新闻和数据的赛前分析预测节目“足球魔方”。
在他看来,国内体育传媒严重滞后于发达国家的水平。“国内体育赛事的转播模式十分单一,而且深度、专业的体育内容不多。”也正因为存在诸多问题,才让陈昊嗅到了商机。做国内跨媒体体育社交服务商的想法也刚好迎合了查立对于互联网的判断。
有激情、有梦想、执行力强、善于思考……是陈昊给记者最直观的印象,刚好吻合了起点创业营喜爱的创业者的特征。而更为重要的,是一份破釜沉舟的决心:“为了创业,我鼓励我们团队全部都搬到园区附近租住,以便全心全意地实施我们的创业大计”。
让创业不再孤独
虽然陈昊在此之前已经从事体育产业十几年,并追随“温格教授”的足迹,专赴足球经济最发达的英国拿下了足球营销的MBA学位,然而要落实到具体的操作层面,遇见具体的事情时,依然会有很多困惑。
毕竟,入驻起点创业营,要获取的不仅是较为低廉的租金和办公成本,更重要的是内在的“软件”优势。
“这里有一个较好的培训机制,每周的创业公开课,会根据创业者自身需要面对的问题进行详细的讲解。”作为创业公开课的忠实听众,陈昊之前所学的理论知识通过梳理和实战渐渐“落地”。在入驻“起点创业营”短短几个月的时间里,“欢呼吧”网站以及“足球魔方”电视节目已经开始运作。
不仅如此,创业者的聚集,带给陈昊更多的交流。“通过别人的成功和失败来反观自己,而且创业过程中遇到的诸多问题还可以进行深入的讨论,这样的分享非常有用。”而更为重要的,陈昊认为这消除了创业者的孤独感。
“虽然在起点创业营里的诸多创业企业是来自不同的领域,但通过时不时的交流,可以对其他行业有更深的了解,同时对于激发自己的灵感也很有帮助。”对于善于学习的创业者而言,学习的机会总是自己给自己的,这点在陈昊身上尤为明显。这也是查立青睐“欢呼吧”的重要原因。
关键词:微信 电视 应用
2011年1月21日,由腾讯公司所打造的微信面世。微信推出不久,用户数量便一路飙升。在微信用户总数就要突破4亿之际,微信“海外版”weChat的注册用户数也突破5∞0万。微信异军突起的主要原因在于它实现了通信、社交、平台化三者一体,很大程度上改变着人们的通信和社交方式,改变着人们的思维和行为方式。同时,对新的技术手段、新的传播渠道、新的娱乐方式的整合是电视媒体的发展趋势。而微信的特点恰恰与电视媒体的发展趋势相吻合。因此,研究微信在电视媒体中的应用对于电视业发展具有积极的推动作用。
与以前相比,经过新媒体冲击的电视媒体对微信表示出很大热情,纷纷把微信引入日常节目运营。以省级卫视为例,截至2013年7月11日,全国31个省级卫视中,其有19家卫视及其卫视所办栏目开通了官方微信(以取得微信认证有“V”标志作为官方微信开通的标准),具体情况如右表。
在其余的11个卫视中,东方卫视虽没有开通官方微信,但是其所办栏目“顶级厨师”“谁是大擂主”“梦立方”均开通了微信,一定程度上弥补了东方卫视官方微信未开通的缺陷。而其他JD家卫视,既没有开通官方微信,也没有任何栏目进驻微信。
微信在电视媒体应用中的问题
从对微信的应用看,各电视媒体还没有形成一套可供参考的标准,也没有成熟的应用方式和方法,在实际应用中存在很多问题。
1.经营管理不重视
在目前上线的19家卫视官方微信中,有一部分卫视虽然开通了官方微信,但仅仅停留在开通的状态,并没有从根本上重视官方微信的建设经营。电视媒体微信要进行信息及时推送,有重大事件要第一时间通知受众。但是很多电视媒体的官方微信并没有做到这一点。
2.推送内容不全面
电视媒体微信的主要功能之一,应该是为观众提供通过其他渠道很难获得的内容,包括节目制作的台前幕后等等,与电视媒体其他的品牌推广和内容传播形成立体互补的格局,而不是内容重复、方式雷同。电视媒体应每天对各种相关信息进行精挑细选,组成内容大餐推送给受众,在内容推送上应该全面丰富,避免出现片面单一的情况。但是,很多电视媒体的官方微信演变成单一栏目的微信,只介绍某一个栏目具体节目的相关信息、而关于整个电视媒体的整体情况,主持人的背景等应更丰富的信息却有意无意地被忽略。
3.受众互动不充分
微信最大的优势就在于即时互动,而且能做到文字、声音画面甚至视频兼备。电视媒体应用好微信的这一功能,弥补自己互动性不足的问题。而实践中很多电视媒体却仅仅把微信当作一种单纯的节目预告工具,对于它的互动功能没有给予足够重视。一是对于受众的信息回复不够及时,让受众有被冷落的感觉。二是互动形式单一,基本使用文字互动。三是等客上门,很少有利用微信的摇一摇、漂流瓶等功能主动寻找受众的。四是微信服务的针对性不强。而微信的各种功能为电视媒体识别不同的受众并对不同的受众进行分类管理提供了方便。对微信这种功能的不了解导致了电视媒体通过微信提供的服务只有共性,没有特殊性。五是向受众推送的多,让受众参与的少。对于主体意识觉醒带来的受众要求参与到电视传播活动全程的要求没有引起足够重视,没有或者不想积极利用微信这一受众广泛接受的手段和途径,引导受众成为电视传播活动的主人。
电视媒体应如何深度应用微信
电视媒体在应用微信的过程中,既要遵循大众传播的规律,又要遵循人际传播的规律。
1.受众黏合
微信在功能设置上为电视媒体争取受众提供了很多通路和渠道。电视媒体目前的微信用户基本上是坐等客户上门而来,通过积极招揽而来的很少,用得较多的是二维码。电视媒体应突破既有局限,深入挖掘微信的功能,吸收和固定微信用户。
用好漂流瓶功能。一方面主动“捡一个”。电视媒体在微信漂流瓶的海洋中捡拾与节目定位相似的漂流瓶,“捞”到后可以和对方进行对话,使其成为自己的用户。另一方面主动“扔一个”。电视媒体可以用语言或文字等做成漂流瓶投入大海,等其被其他用户“捞”到后打开对话。为吸引受众“捞”的兴趣,电视媒体可以把漂流瓶设计为公益活动或奖励等。
用好“摇一摇”功能。电视媒体要定期“摇一摇”,发现目标受众,利用爱好、背景、区域等与节目的相似性,或者明星、著名主持人等的近距离接触作为激励手段,更多吸引其他微信用户成为受众。
用好位置签名功能。微信用户有利用定位功能——“查找附近的人”的习惯,根据自己的地理位置查找周围的用户。电视媒体可以在微信的用户签名档加入受众感兴趣的信息,在微信用户查找附近的人时向他们推销自己的节目,引起他们对节目、对微信的关注。
用好敞开平台功能。运用微信敞开平台,电视媒体可以通过微信的敞开接口接入第三方使用,使微信用户可以随心所欲地利用第三方使用功能挑选电视的微信内容,并方便地共享这些内容。
2.内容推送
电视受众与微信用户之间是一种强相关的关系,如果不管微信用户的心理特点,不考虑他们的需求,不加区别地向他们推送各种节目信息,必然会招致反感甚至抵制。应研究受众都喜欢什么样的信息,喜欢什么时候接受信息,喜欢用什么方式表达等,然后再利用公众平台的推送功能有的放矢地推送。
可以在微信中推送节目预告、节目内容等常规信息,但这类信息由于受众在常规渠道都可以轻松获得而没有差别性和必需性。电视媒体在推送内容时应加以创新,不断以新形式和新内容满足受众好奇心。当前卫视官方微信所进行的内容推送中,比较受喜爱的是主持人或明星嘉宾与受众互动聊天的方式,受众可以通过微信与他们进行语音交流,这种互动形式感觉更加真实,受众可以通过这种方式更近距离“接触”明星。
如东南卫视的官方微信每天以一个时下热点话题作为主要推送内容,在版面设计上,图片所占位置多于文字所占篇幅,整个卫视官方微信感觉像一本图片杂志,视觉效果强烈。安徽卫视的官方微信遵循其卫视母体定位,走“剧行天下”的路线,在版面编排上,热播剧的内容永远排在前面,并且配以相关图片。除此之外,安徽卫视还开辟了官方微信栏目——《海豚幽默》,主要内容是一些短小轻松的小笑话,用来取悦受众。湖北卫视官方微信为其重点打造的节目“我的中国星”制作微信特刊,整个特刊分为S个小标题,多角度全方位的报道“我的中国星”,让人对这档节目印象深刻。
3.受众分析
在媒体市场日益细分和窄众化的今天,了解哪些人是自己的受众,哪些人是自己的忠实受众,这些受众的心理需求和行为特征有什么特点等对电视发展至关重要。电视媒体能够通过分析微信用户与电视受众之间的转化关系来掌握自己受众性别、年龄等基本情况。同时,通过微信的“摇一摇”等定位功能,电视媒体可以对受众区域分布有较为详细的了解。
以微信带来的基本数据为基础,电视媒体应利用文本分析技术对受众的发言频次、发言内容等做更深层次的文本分析,进一步挖掘受众数据。
4.受众参与
受众越来越要求成为电视传播活动的主体,越来越希望参与到整个电视传播活动的过程中。电视媒体应用微信的目的,除了进行品牌推广和市场营销外,还应把微信经营成为受众参与电视传播活动更为直接、更为方便的途径。
电视媒体对微信的应用可以分为与节目播出同步、与节目播出不同步两种。与节目播出同步的微信应用可以定义为微信直播。一方面,微信直播可以使电视媒体与受众实现实时互动。另一方面,实时互动是电视媒体与受众互动的最高境界,在电视直播难度大、难以为受众实时互动提供条件的情况下,微信直播创造的实时互动将有可能带来电视传播模式的变革。
参与讨论。在电视直播状态下,电视媒体可以同步开通微信直播。可以有意识地开办话题性讨论节目,让受众通过微信实时发表对特定主题的意见和看法。电视媒体把这些观点加以整理、分析,应用到节目中,既可以作为节目的观点主体,又可作为既有观点的佐证或论据。
提供内容。通过微信用户提供节目内容,不但可以丰富电视媒体的内容资源,而且由于受众拍,拍受众,具有较好的贴近性。
Abstract: While the tourist development of World Cultural Heritage Sites brings great profit to local economy, problems inevitably come to occur. To solve the problem, this essay takes the Kaiping Diaolou World Cultural Heritage Sites as an example, collects the tourist comments and journals from Internet media namely Tuniu, Tongcheng, Lvmama, Mafengwo, Baidu Tourism, concludes the tourist feedback and needs, so as to analyze the problems taking place in the process of tourism development. Hope this essay gives an insight and inspires effective development and preservation of Kaiping Diaolou World Cultural Heritage Sites in the future.
关键词:旅游数字足迹;开平碉楼与村落世界文化遗产地;游客需求;游客旅游感知
Key words: tourist footprint;Kaiping Diaolou World Cultural Heritage Sites;tourist demand;tourist perception
中图分类号:F592.7 文献标识码:A 文章编号:1006-4311(2016)32-0076-04
0 引言
网络逐渐拓展为人们搜集信息、发表言论、分享经历的跨时空社交空间。根据中国互联网信息中心(CNNIC)的《第36次中国互联网络发展状况统计报告》[1]显示,截至2015年6月,中国网民规模达到6.68亿。与此同时,互联网让传统的旅游业重新焕发生命力,两者的结合使旅游信息传播媒介从传统媒体逐渐转向新兴网络媒介,如微博、微信、旅游论坛等社交平台、在线旅游电子商务和商圈网站等。互联网使线下线上的信息融合贯通[2],游客旅游前对目的地进行信息搜集和产品购买;旅游过程中使用app查找交通线路、食宿信息;旅游后对目的地的真实体验与关注偏好以图片、文本等形式在网络社交、旅游电商平台游记或评论[3],其中所留下的搜索、浏览、消费、导航、评论等记录,逐渐形成“旅游数字足迹”。在互联网良好态势和“旅游数字足迹”的可利用性下,许多遗产地没有根本地解决景区开发与保护的问题:遗产地景区的客流量控制不足、官方营销点与游客关注点错位、官方管理运营模式无法适应时展以及游客满意度、重游率不高等[4]。
1 研究背景与相关研究进展
旅游业被称为信息依赖型行业,因为在一定地域上被生产或开发出来的旅游产品具有无形性、生产和消费的同步性、不可储存性和季节性的典型特征。而目的地及其旅游企业的产品销售在很大程度上依赖于信息的传递,所以信息被看成是旅游业的命脉[5]。随着信息技术的迅速发展,信息的传递与获取方式均发生了巨大变化。互联网凭借其开放、共享、交互的特性使得大量旅游信息得以有效交汇[6]。游客会在出行前搜集与旅游目的地相关的信息;出行后,以游记、评论等形式自己的旅游体验又会形成与旅游目的地相关的信息;游客在旅游过程中对旅游目的地的真实体验与关注偏好逐渐通过网络文本所反映[7],所以游客在各种“媒介”所留下的“旅游数字足迹”即游客的各种出行信息、对旅游目的地的感知、评价等数据的搜集与挖掘成为可能。
“旅游数字足迹”作为了解旅游目的地与反映游客感知的大数据,引发了研究热潮,被广泛引用于国内外旅游的不同研究。国外研究者Reilly[8]、Andsager[9]等较早将旅游数字足迹运用于旅游关注研究中;2009年,美国的Vaccaci等利用游客分享的线上图片、通话记录等旅游数字足迹数据研究得出纽约不同景点接待游客的时间分布趋势;2013年,国内的李君轶通过网上游记、攻略和图片在线揭示游客的时空轨迹[10];梁保尔等(2015)根据搜索引擎、网络游记文本得出上海历史街区官方宣传与游客关注差异及成因[11];李艳等(2015)借助社会网络分析法对赴游客旅游数字足迹空间结构进行研究[12]。目前国内关于旅游数字足迹的研究主要是单一运用网络文本数据或是百度指数数据,研究成果也主要是通过游客旅游感知的调查,指导旅游目的地的营销。本次研究将百度指数和旅游在网络留下的文本信息数据结合起来,二者相互补充,更加深入地分析开平碉楼与村落世界文化遗产地在旅游开发中所存在的问题,进而回馈指导开平碉楼与村落世界文化遗产地的保护和开发。
2 研究设计
2.1 案例地概况
开平碉楼与村落遗产地位于广东省江门市的开平市境内,始建于明末清初。1999年原国务院办公厅干部李玫建议开展开平碉楼与村落的申遗工作。2000年10月1日立园正式对外开放,并于2002年12月被评为国家4A级旅游景区。在李玫的推动下,开平碉楼与村落于2001年被列入国家重点文物保护名单,其中开平1833座碉楼被收录进文化保护名录。2007年,开平碉楼与村落成功被列入《世界遗产名录》,成为中国第35处世界遗产,首个华侨文化的世界遗产项目。开平市政府一直致力于碉楼的修复和环境整治,目前,大部分碉楼采取政府托管和社会热心企业、个人认养的方式进行管理。申遗的成功使游客量倍增,极大地促进了开平碉楼与村落旅游业的发展。到2015年,开平游客接待总数为573.07万人次,旅游总收入为52.09亿元。近几年,开平碉楼与村落遗产地开始着力促进旅游信息化的建设。2015年,开平碉楼与村落景区与国内先进旅游电子商务专业网站的合作,实现网上售票和自助取票。同时,开平碉楼与村落遗产地还开通了“景区公众微信号”和官方微博,不定期地向公众推送景区最新的动态、新的旅游产品与项目以及优惠促销活动等。
2.2 研究方法与数据来源
本文以游客在网络留下的“游记、评论”等旅游数字足迹作为研究样本,分析游客的行为特征和旅游目的地的感知与评价,主要选取主流旅游电商平台(携程,途牛,同程,驴妈妈)、旅游论坛(蚂蜂窝、百度旅游)和社交媒体(微博、微信)等知名度较高、交互性较强的网站作为收集游客“旅游数字足迹”的媒介。在研究样本收集的过程中,以“开平碉楼”、“开平碉楼与村落”、“开平旅游”、“江门旅游”等关键词作为词条,收集与案例地相关的旅游数字足迹信息。本次研究共选取了45篇星级较高的游记和155条点击率较高的评论,根据内容,将样本分为旅游攻略和游记、旅游产品、旅游简介、游客评价、景区门票五个大类。通过对研究样本的对比,挖掘游客的关注倾向与旅游体验。除此之外,本研究通过百度指数搜索特定关键词“开平碉楼”,收集2011年到2016年网民移动和PC端的搜索指数、调查与关键词有相联性的词语,分析媒体新闻和舆论指数,分析用户背景等信息。通过对旅游数字足迹信息的挖掘与分析,分析开平碉楼与村落文化遗产地在旅游开发中所存在的问题,并进一步提出具有针对性的解决对策,指导案例地的开发与保护。
3 开平碉楼与村落世界文化遗产地旅游数字足迹特征分析
3.1 不同阶段搜索需求对比
来源检索词是过滤关键词上一步搜索行为来源所得出的相关词,将来源检索词按相关程度排序,能够反映用户在搜索关键词之前的搜索需求。而去向检索词反映的是用户在搜索关键词之后的搜索需求。因此,从特定关键词词的百度指数搜索量可以得知网民对该中心词相关信息的需求量[13]。如图1所示,无论潜在游客在搜索“开平碉楼”之前还是之后,搜索量排名靠前与关键词联系较大的都是“门票”“自驾游攻略”“一日游”等。对比来源搜索词,建筑特色、同类型旅游地以及相关旅游线路等去向搜索词的搜索量更多。从中得出潜在游客对开平碉楼的认识是一个由浅入深的过程,也反映出游客对开平碉楼自驾游攻略、门票价格、建筑特色和相关旅游线路产品有强烈的信息需求,但这些是目前遗产地官方网站所提供的信息所不能满足的。
■
3.2 媒体舆论分析
网络信息流与现实世界旅游流存在相关性[14],因此游客的出行意愿与相关新闻报道频率有一定的关系。由图2得出,在2011-2016年期间,有关开平碉楼的媒体报道数量不多,主要是关于电影宣传、主题活动、周年纪念等大型活动的报道,对开平碉楼的建筑特色和侨乡文化价值推广少之又少,而且多数新闻来源于广东频道。这不难推断出开平碉楼的客源地多为华南地区,不利于培养顾客的忠诚度和提高开平碉楼与村落社会影响力。
■
3.3 游客旅游感知分析
本文以途牛、同程、淘宝旅游、蚂蜂窝、百度旅游等网站收集的200篇游记及评论作为研究样本,从评论关键词中整理出游客感知信息,如表1所示。
①旅游吸引物方面,游客对碉楼建筑和村落风光持积极态度;但碉楼相似度高、影视城卫生环境差、商业化严重、物价高等因素造成游客感知消极。这是由于遗产地开发时间短、保护措施未到位、对碉楼价值的挖掘不够深入、定价失误所致的。
②服务管理方面,游客认为门票性价比低,但对售票方式感知较积极。单纯感知服务绩效理论认为,顾客对产品质量的主观评价与消费者期望无关[15]。说明景区的营销未能引起游客共鸣;景区内辅助设施与门票价格不相配套。
③旅游设施方面,游客积极感知度高的方面主要是碉楼的可进入性强,公路标示清晰,自驾游条件较完善。但是,游客普遍反映景区间交通不方便、接送车辆少及发车时间不确定和碉楼附近住宿少等问题。说明景区内基础设施建设不完善,缺乏人性化的管理机制。
■
4 研究结论与展望
4.1 研究结论
利用旅游数字足迹,对开平碉楼与村落世界文化遗产地的开发保护现状进行问题分析,发现目前遗产地存在着一系列问题。而游客在各媒介所“留下”的旅游数字足迹即游客的出行信息、对旅游目的地的感知等数据,对遗产地的建设具有重要参考价值,因此可以运用到开发与保护中去。
①开平碉楼与村落世界文化遗产地旅游产品单一,缺乏特色。
游客对开平碉楼与村落世界文化遗产地的产品需求呈现多样化特征,但遗产地产品的文化性、特色性的开发格局尚未形成。这反映了景区在开发旅游产品时,只局限于现有的旅游资源,没有挖掘其潜在文化价值,忽略与周边产品或景点的联系。
②开平碉楼与村落世界文化遗产地旅游官网的信息主题与游客关注点错位。
网络游记反映出大多数游客关注当地风土人情、特色美食、赤坎图书馆等,而开平碉楼官方网站侧重于碉楼群的建筑特色,村落环境,与游客需求产生错位,导致游客的访问量锐减。这说明在营销宣传上,景区没有关注游客的需求,致使营销效果不佳,且造成资源浪费。
③网络反馈、互动平台和监督机制不完善。
游客游记和评论真实反映了游客在旅游过程中遇到的问题,游客单方面提出意见,但景区没有及时听取意见。这反映双方互动程度低,景区缺乏完善的网络互动平台和监督机制,导致其善后效率低下。
④社会影响力有限。
全国媒体舆论对开平碉楼与村落世界文化遗产地的关注度低,主要是广东地区媒体的新闻消息。这反映了开平碉楼与村落的社会影响力有限,且宣传主题活动力度不够,吸引省外游客前来游玩的动力不足。
4.2 研究启示
①利用“旅游数字足迹”,为研究世界文化遗产地提供有效数据分析。
本研究证明,“旅游数字足迹”具有客观性、时效性、成本低等特点[16],以庞大的数据为基础,能够深入挖掘开平碉楼与村落世界文化遗产地在开发与保护过程中存在的问题,进而有效解决问题并跟进遗产地问题的改善情况。
②依托“旅游数字足迹”,完善网站信息系统。
旅游网站是游客认识景区的一种重要途径,以“旅游数字足迹”作为数据支撑,建立具有遗产地特色且满足游客多元化需求的旅游信息平台,并加强其使用安全性、便捷性。另外,结合“旅游数字足迹”分析,开启更为人性化的游客线上体验模式,以此提高开平碉楼与村落世界文化遗产地的公众关注度,形成品牌效应。
③构建网络反馈、互动平台和监督机制。
构建完善的景区网络反馈平台,增设景区与游客间的互动板块,逐渐形成监督机制,保证监督效能。使开平碉楼与村落世界文化遗产地的开发与保护透明化,提高顾客的忠诚度与满意度,做好口碑营销。
④加强开平碉楼与村落世界文化遗产地数字化管理。
建立数字景区系统,完善景区监控系统、售检票系统、电子显示屏等设施,抓好数据源头工作,有效监控客流;挖掘网络后台的大数据,线上信息引发线下消费,线下消费反馈线上口碑,从而提高景区整体发展水平和游客满意度;挖掘游客背景信息,数字化分析景区市场导向和潜在市场,针对性开发新型旅游产品。
参考文献:
[1]中国互联网信息中心(CNNIC).第36次中国互联网络发展状况统计报告[R].2015.
[2]季良纲. “互联网+”与信息科普化[J].科协论坛,2016(7):17-20.
[3]潘值强,梁保尔.基于旅游数字足迹的目的地旅游形象游客感知研究――以新疆天山世界自然遗产为例[J].北京第二外国语学院学报,2015(5):40-48.
[4]刘智兴,马耀峰,高楠,张岩君,王玎玎.山岳型旅游目的地形象感知研究――以五台山风景名胜区为例[J].山地学报,2013,31(3):370-376.
[5]周晓丽,李振亭.基于百度指数的搜索引擎中旅游行为研究――以西安典型旅游景区为例.天津商业大学学报[J].2016,36(3):11-16.
[6]姚占雷,许鑫,李丽梅,等.网络游记中的景区共现现象分析――以华东地区首批国家5A级旅游景区为例[J].旅游科学,2011(2):39-46.
[7]王媛、许鑫、冯学钢.基于文本挖掘的古镇旅游形象感知研究――以朱家角为例[J].旅游科学,2013(5):86-95.
[8]Reilly M D. Free elicitation of descriptive adjectives for tourism image assessment[J].Journal of Travel Research,1990,28(4):36-43.
[9]Andsager J L,Drzewiecka J A.Desirability of differences in destinations[J].Annals of Tourism Research,2002,29(2):401-421.
[10]李君轶.旅游数字足迹:在线揭示游客的时空轨迹[J].思想战线,2013(3):103-107.
[11]梁保尔,潘值强.基于旅游数字足迹的目的地关注度与共现效应――以上海历史街区为例[J].旅游学刊,2015,30(7):80-90.
[12]李艳,严艳,O欣.基于旅游数字足迹的景区空间结构分析[J].干旱区资源与环境,2015,29(6):176-182.
[13]周晓丽,李振亭.基于百度指数的搜索引擎中旅游搜索行为研究――以西安典型旅游景区为例[J].天津商业大学学报,2016,36(3).
[14]张维亚.文化遗产地旅游者消费行为数字足迹特征与机制研究[D].南京师范大学,2015.
老板问:“怎么衡量社交给我带来的价值,而不是一波夸夸其谈的潮流?”
社交答:“对内我是协作的好工具,对外我是开拓市场的好帮手,重点是你们怎么用我。”
在中国传统戏剧中,一般把忠臣或者好人扮成红脸,红色是正直的象征,而把奸臣或者坏人扮成白脸,白色是奸邪的象征。其实信息技术的应用也常常被冠以红白之分。对于红白的定义,现代社会中人们用“一个唱红脸,一个唱白脸”来表示在做一件事情的时候,两方合作达成好的结果。社交之于企业的作用似乎正扮演着这样的双重角色,当围绕消费者模式(如Facebook和Twitter;微博和微信)产生的种种能量和机会汇集在一起,并开始对商业挑战发挥影响时,企业社交的内涵更加丰富了。
虽然有人质疑,有人标榜,但人们相信商业已经进入到社交化时代,结果如何,那得看企业用什么?如何用?
一个硬币总有两面
“一位办公室职员打开一块雀巢奇巧巧克力,结果发现包装纸竟是猩猩的一只手指”,对于这段2011年在线视频里的场景,雀巢的高管和绿色和平的拥护者都该留有深刻印象,这正是雀巢在社交媒体上遭遇的一次声势浩大的抗议活动。因为雀巢的产品中要用到棕榈油,而其棕榈油的供应商正在摧毁印度尼西亚的热带雨林,破坏猩猩的生存环境。
这段视频呼吁绿色和平组织的Twitter粉丝们去攻击雀巢这家瑞士公司的Facebook页面,结果有150万人次观看了视频,超过30万人次直接通过电子邮件与雀巢首席执行官进行了联系。更有不计其数的人在雀巢的Facebook粉丝页面上持续留言批评,甚至有人把奇巧品牌的英文标识“Kit Kat”修改成“Killer”。最终,雀巢出面承诺到2015年要做到仅用经过验证的可持续棕榈油产品。
可以说这是绿色和平组织利用社交媒体取得的一次成功,但对雀巢这家企业来说,却是一次危机。在这个时代,社交媒体为公众提供了一个观察、讨论、分享的平台,企业的市场营销官们对自身品牌的控制权仿佛正在失控,因为品牌的维系、宣传、甚至被摧毁都更多的被公众或是竞争对手所影响,但从长远来看,正是这种环境监督激励企业从各个方面力求“完美”的要求自己,使得企业行至更远的将来。因此从这个层面看,社交确实发挥了“正能量”。
说完发生在瑞士雀巢公司的社交事件,我们再到澳大利亚的卡夫食品公司,看看他们是如何利用社交做市场决策的。
作为世界第二大的食品和饮料制造公司—卡夫食品公司,他们生产着一款叫Vegemite的咸味酱。令人惊讶的是几乎70%的澳洲人早起的第一件事,除了冲杯咖啡外,就是在烤面包上抹上一层Vegemite咸味酱,这种咸味酱成为了澳大利亚的国民食品。
为了能更好地了解消费者的需求以进行潜在的产品升级,卡夫食品公司与IBM携手,挖掘其全球的Vegemite品牌消费者的真实想法。双方合作利用基于文本分析的工具,在10.5亿条博客、论坛和讨论版的内容中抓取了47.9万条关于Vegemite的讨论信息,通过对这些社交网站上的非结构化数据的深层分析发现,大家谈论的热点并不是Vegemite是否过咸,也不是产品的包装,而是不同的吃法,以及在其他国家怎么买到Vegemite。
同时,语义分析显示出了大家普遍关心的三个趋势:健康、素食主义和食品安全。在关于健康的讨论中,一种学名为叶酸的维生素B复合体被频繁提到,叶酸为人体代谢所需,对孕妇尤其重要。这个信息对于卡夫食品公司调整营销策略有很大的启示,也为卡夫进一步打开孕妇消费者市场提供了依据。
从这个例子中人们不难发现,对企业来说,市场策略的制定应该更注重最终用户的反馈和其社会化网络的参与,这不仅能增强品牌的忠诚度,提升企业内涵,还能为发现潜在用户提出有效的方案。
而在以上这两个案例中,社交其实在扮演着不同的角色,可能对于雀巢来说,他们因此遭受了舆论的“攻击”,不得不公开道歉并做出承诺改变。而卡夫食品公司却由于主动利用社交工具,挖掘了潜在的消费市场。社交红与白的面孔不断地展现在企业面前。
当然你也可以认为,以上这些案例只是凤毛麟角或是带有某种宣传的意味,或者质疑这只是市场营销的一种手段,这样的企业社交应用很狭隘。但你无法否定的是,社交已经成为企业不可忽视的因素,“社交商务、企业化社交、社交营销”这些词汇层出不穷,都在表明这一市场正在发酵。
一木不成林 百花才是春
纷繁众多的社交工具从消费端不断向企业端融合,无论是即时通讯软件、SNS社交网站,还是近年来兴起的微博、微信,都开始在商用领域发光发热;另一方面,一鸣惊人的Yammer激励着社会化管理软件、企业内部协作平台如雨后春笋。企业社交市场热闹非凡,国际IT巨头们也涉入其中,微软、IBM、甲骨文、SAP等相继通过收购布局企业社交市场。
与此相对的是,中国的企业社交也逐步进入到一个新的阶段。有统计显示,截至2013年一季度末,新浪微博用户数已突破5亿,其中企业微博用户已经超过30万,包括143家世界500强企业和207家中国500强企业,该数目依然在持续增长中。可见企业社交这池春水已彻底被激活。
然而,多少带着些洋味道的“企业社交”本土化做得如何?又是否能被中国的企业和员工接受?这种社交模式对于企业究竟能产生多大价值呢?想知道这些答案,不妨听听企业是怎么说的。
“双微”布局企业级市场
国外的Facebook和Twitter持续火热,在国内人们同样沉浸在微博和微信中,社交工具已全球广泛接受并应用是不争的事实。多达几亿人的用户量让新浪和腾讯两家公司赚足了市场,尽管此时讨论成熟的商业模式还为时过早,但他们正在向企业级市场发力。
据新浪公关部毛涛涛介绍说:“为了给企业用户提供更好的产品体验,新浪微博为其提供了专业版微博服务—企业微博,并于2012年4月完成了第一轮产品升级。升级后的企业微博2.0版本,全面支持企业在微博上进行自主展示、数据分析及应用共享,除了给予企业更丰富灵活的展示空间外,还提供超过60项专业数据分析,同时我们开放了更多的第三方应用接口,为企业提供‘微热卖’等个性化应用。”
随着越来越多的企业入驻微博平台,新浪微博也在不断优化商用端的产品。目前企业级用户的需求主要分为两大类,一是品牌用户,二是中小企业。针对中小企业用户,2013年3月中旬,新浪微博推出了基于信息流广告的“粉丝通”产品,并提供具有针对性的中小企业套装。同时,也通过服务商平台引导第三方公司,为微博上的中小企业提供一体化服务。
艾瑞咨询分析师杨雪斌认为,国内中小企业数量庞大,中小企业网络营销市场还具有相当大的挖掘潜力,新浪微博庞大的社交媒体流量,是吸引中小广告主的最大筹码。
“针对一些有需求的品牌用户,我们推出了微博‘闪购’模式,从去年年底开始,新浪微博相继同小米、奔驰和乐视合作,在社会化电商方面进行尝试,帮助企业在微博平台上打通营销闭环,同时也验证了微博用户的消费能力。企业在新浪微博上发起‘闪购’,一方面可以在短时间内把传播效果最大化,在微博平台上打通预约、购买、下单到支付的销售闭环,迅速获得高销售额;另一方面,微博平台具备上佳的口碑传播效应,将帮助企业实现优质用户的积累,为后续的二次售卖打下了基础。”毛涛涛如是说。
2013年4月,新浪宣布与阿里巴巴达成战略联盟,在账户互通、数据交换、在线支付、网络营销等领域进行深入合作。双方达成合作后,于2013年5月推出了“橱窗广告”,在获得了较好的市场反馈后,8月5日,新浪微博与淘宝网推出了针对卖家的以“微博淘宝版”为核心的一系列产品。企业可以用新浪微博或淘宝网的任一账号,进行双平台操作,而的淘宝相关信息则以丰富的卡片化形式展现,一方面节省了企业的推广、管理效率,带来更多流量;另一方面,企业还可以利用新浪微博的社交化数据分析,更好地指导社会化营销。
从这一连串的市场动作来看,新浪微博在商用市场上的发力是循序渐进的,以最初聚焦大量个体人群为基石,为个人和企业提供“发声”的平台,而后,转入更深层次的应用,比如提供营销方案、数据分析等企业级应用,在打造成熟的商业模式方面不断探索。
稍晚于新浪微博推出的腾讯微信也不落后,从2011年年初上线到2013年1月,注册用户已超过3亿,目前有18种语言版本,遍及200多个国家和地区,海外用户已超过了7000万。微信起初是一款为智能手机提供即时通讯服务的免费应用程序,随着产品不断丰富,加入了基于位置的社交插件“摇一摇”、“漂流瓶”、“朋友圈”、“公众平台”、“语音记事本”等服务插件。
那么微信在企业级市场的思考是什么呢?
记者联系了负责腾讯微信的公关经理,但对方以微信5.0刚推出,不宜对外接受采访为由拒绝了采访。即便如此,我们依然能从微信的企业级应用及微信高管的言论中窥见其布局的脉络。
招商银行在2012年推出微信客服号,那时只支持简单的业务查询及余额查询。接着招商银行开始推广其“信用卡微信、QQ智能服务”,包括给大量信用卡客户邮箱发邮件推广。现在,招商银行的信用卡微信号支持的不只是余额查询,在招商银行手机银行能办的业务,几乎都可以实现,比如余额、积分、账单、清单、密码重置等。通过文字交互后,招商银行公众号会进行引导,如果有必要,会引导到手机网上银行进行操作。这一步需要在微信对话框输入查询密码鉴权。查询余额、积分等则不需要每次都鉴权。
微信更倾向于为企业打造服务平台,而不仅仅是直白的营销而后扩大影响力,从招商银行的微信应用案例中就可以看出,使用此应用的人一定是招商银行的用户,而微博大范围的“触达量”锁定的不仅仅是品牌的唯一受众,还包括更多非品牌使用者。
腾讯微信提供企业服务力量的核心工具是微信公众平台。据统计,不到一年的时间,微信公众平台上已经有超过100万的公众帐号,其中认证过的公众帐号超过4万,70%以上都是企业用户。
在腾讯合作伙伴大会分论坛上微信产品部助理总经理曾鸣说:“我们对微信公众平台的规划是完全以用户沟通为基础,形成一种互动关系,在互动关系成立之后形成一种服务的定制。在这个基础上,微信公众平台可以服务公司内,也可以服务公司外,其中,在企业CRM,以及软硬件交互、在线支付、会员卡绑定等更多的高级能力上,我们会通过各种典型应用,逐步呈现出来。”
初生牛犊不怕虎
“双微”的迅猛发展也给不少公司带来了创业的梦想,苏州悦果互动信息技术有限公司(以下简称悦果)就是其中一员,其执行董事王甲佳介绍:“去年微信开放平台刚一出来,我们就跟进了,当时我们发现一些公司通过短信来做用户沟通,里面存在着硬成本,为了节省这方面的支出,我们就与微信公众帐号的开放平台做了对接,利用微信做企业客户沟通,例如团购网站等。
他认为微信的企业应用是一种趋势,过去,大家都去银行柜台接受人工服务,银行要付出人力、物力,后来ATM遍布城市,银行基本省去这部分人力,只投入硬件,再后来又有了网银,银行向客户提供优盾或密码卡,硬件投入可以忽略不计了,现在用户使用微信就可以完成大部分的银行业务,用户使用自己的手机即可完成,这对银行来说,节省的人财物还是很可观的。
另外还有一个业务场景是王甲佳关注的:将客户引入到企业的CRM系统。比如某公司销售去拜访一个客户,沟通交流后销售就在公司系统里面做拜访记录。那为什么不能建立一个机制让客户来做呢?“实际上我们为客户服务的系统往往是没有客户的,微信的出现就可以改变这个局面。比如说一两千人的企业,在信息系统中并发用户数可能有200个,注册用户数可能有500个,渠道商可能有1000个。通过微信,可以让更多群体融入公司系统。”
那么对于悦果这样以社交工具为核心,进行二次开发或为企业提供相关解决方案的公司,难道不怕被“双微”这样的企业吞掉吗?王甲佳认为:“不做深度的微信开发,比微信运营商跑的快会带来麻烦,比如版本更迭和使用规定等;第二,不看好群发消息、朋友圈广告,只要把企业既有的关系移到微信即可。因为微信平台不主张过分营销;第三,尽可能做细分的行业需求,而对于微信来说,他们的专注不在这。”
对此,北京中天威科网络技术有限责任公司(一家社交媒体管理公司,业内俗称“孔明公司”,以下简称孔明)CEO鄂威的敏感度更高:“我觉得最核心的一件事情是我们跟社交平台的商业逻辑是什么,现在看有两种:一种是抢平台的钱,一种是帮平台赚更多的钱。第一种可能不太好做,第二种不仅会跟平台有很多合作,还会得到支持,这是我从做这家公司一开始就已经想透的一个问题,我们绝对不能与平台做对立的事情。”
那么孔明公司的关注点在哪呢?作为一个年轻的公司,活下去已经不容易,想活得有滋有味更难。
“我们的核心产品叫预测引擎,是基于社交平台上的数据为客户做分析,比如,母婴的客户关注小孩或者正在怀孕的妈妈,我们在不知道这个人的基本信息下,为客户精确地定位这个人在未来会有一些什么样的行为、兴趣、爱好和状态的变化。其中一个最实际的问题就是要判断这个人是不是妈妈,很多人认为这些群体会在微博上‘怀孕’的字样,而实际上这样写的妈妈很少。但是我们通过一些深入的数据分析会发现,发“数字+W”的群体是妈妈的居多,因为她会记录‘我怀孕10周了,我怀孕20周了’。那么如果这个人提到F1,她是妈妈的可能性就会降低20%,因为通过数据分析,我们发现是妈妈的人,她不太关心看F1赛车了。”鄂威如是说。
谈到核心的数据分析,问题就来了,现在火热的大数据不正在做着这件事情吗?
IBM、甲骨文、SAP这些IT大鳄们不都在这方面有强势表现吗?与这些企业相比,孔明这样的初创企业未免太稚嫩了吧。对此,鄂威很有信心,“我们不愿意定位公司是在做‘大数据’的工作,这个词的炒作概念更多,而且这些谈在社交上发力的大公司,通常都以收购的方式布局市场,而在领域的专注性上看,不一定大公司一定强,我们公司上上下下80多人三年半的时间都在研究这个,大公司投入的心思又有多少呢?另外,这些大公司在策略和战略上也晚了些。”
IT大巨头们的社交心思
虽然不少人认为IT巨头们尾大不掉,布局社交策略有些晚,也有人会认为发源于互联网,以移动终端带动的社交对于传统的IT企业来说基因不对,但已经没有人会质疑,社交媒体得到了迅猛增长并且很可能将继续增长,也没有人会质疑社交媒体的影响会更加深入和广泛。所以,企业们都在努力寻求从海量数据中获取洞察的方法。
据了解,戴尔公司有一个社交媒体监测指挥中心,将社交媒体上消费者的海量留言、评论进行过滤,并通过服务团队过滤和回应,这项计划令1.3万名公司员工能够直接与消费者对话。例如:一条微博信息内容显示,“为研发部门购买10台笔记本电脑,希望并行计算处理能力更强”,根据分析,一方面营销部可以直接为客户提供折扣,促使其下单购买;另一方面,对于此类没有明确品牌购买倾向的用户,市场部需要通过持续的品牌优化计划来加强用户对戴尔品牌的忠诚度。
虽然“顾客是不是上帝”在营销学中的讨论从未停止,但以客户体验为中心规划产品方案、制定企业战略已经是不争的事实。近日,在2013甲骨文全球大会上,甲骨文就明确提出通过社交提升客户体验,不仅把社交平台涵盖在其行业解决方案中,还渗透到各个产品的方方面面。因为社交媒体中发生的各对话的因果关系、相关性和含义对于整体营销、品牌推广、销售、业务智能、客户服务、预测分析和市场研究等至关重要。
同时,为了更符合中国本地化的需求,甲骨文将不断扩展平台,使其适应多样化的社交媒体渠道,也将与本地的系统集成商合作在微博、微信等社交平台上做出突破。
就像2012年《福布斯》评论预测的那样:“微软收购Yammer只是一场序幕,接下来这个行业内会有更多并购发生,那些尚未收购任何社交公司的IT巨头正摩拳擦掌。”这个预测快就得到了印证,各大巨头纷纷收购社交市场活跃的技术型公司,但他们更注重的是搭建内部协作、沟通、提升工作效率的平台,在这一点上,IBM表现得更为突出,其为企业提供定制化的社交商务平台。据悉,超过60%的财富100强企业都已选择IBM社交商务解决方案,其中包括8家排名前10的零售企业和银行。在为各行业领先企业提供服务的过程中,IBM逐渐积累了丰富的行业经验,并将这些成功实践转化为交付多样化产品的能力,帮助企业落地社交商务解决方案。
全球性的建筑材料公司西麦斯就是其中的一个客户,据了解,西麦斯在50多个国家拥有4.7万余名员工,与很多大型跨国企业一样面临着内部协同的问题。因此,西麦斯公司基于IBM Connections社交软件创建了内部的社交协作平台Shift,该平台包括博客、维基、社区、论坛和帮助工具。在不到一年的时间里,超过25000名的内部员工通过Shift与全球的同事沟通协作。平台上创建了500多个基于工作和项目的社区,员工实时通讯、共享信息,实现了协同办公。
在2013 IBM移动社交商务高端峰会上,IBM软件集团大中华区协作解决方案总经理李贵兴表示:“IBM不断完善社交商务平台的能力,将人员、内容、数据等各方面资源连接起来,满足企业转型成长所需的移动社交力。”
传统软件企业不甘示弱
如果处于初创期的中小企业认为自身的互联网“基因”是不可磨灭的,那么也许他们并不惧怕被市场抛弃,如果IT大鳄们通过大手笔收并购,以及行业底蕴发力社交市场,他们一定也不畏惧起步晚、不够灵活的质疑。而对于本土传统的软件公司来说,他们是否能搭上驶向企业社交春天的列车呢?
“2011年,我们先后接到很多客户的需求,希望优化既有的移动办公解决方案,将流行的个人SNS应用引入到企业,整合内部信息系统和外部资源,实现更加高效的沟通协作。刚开始我们很惊诧,认为这个观念有点超前,但经过仔细的分析研究发现,这里面有很大的文章,其不仅跨越了移动商务的范畴,还将协同由企业内部延伸到外部,颠覆了传统管理和协同的概念。”北京荣之联科技股份有限公司副总裁丁洪震说。
在荣之联看来,社会分工的细化融合和科技进步已经对传统的协作管理模式提出很大的挑战,丁洪震说:“你可以在家办公,你可以借助手机随时随地的沟通,你在咖啡馆查阅明天要和客户交流PPT的素材……社会的飞速发展使得人们工作、学习、生活的时间界限越来越模糊,个人和企业的工作边界越来越淡化,这样就导致以内部资源为主的流程,制度,命令等传统管理方式很难适应,整合个人内外部的资源,跨越个人和企业的边界,突破传统层级工作协作方式,构建新型点对点的平面协同体系,创造自发、激励、共享、学习、平等的沟通文化已经大势所趋,这也是企业SNS的基本诉求。”
企业内部的这种改变,王甲佳也颇有感受:“现在很多企业的员工多是80后,到底怎么管理?结论是‘只能理,不能管’,现在90后都大学毕业成为劳动主力了。传统的方法肯定不行,布置工作你可能只需告诉他一个大概的东西,千万不能描述成一、二、三、四,这是针对于大多数中小企业的。大公司可能有差异,但是很多管理问题都是不注重人员组成的特点而造成的,沟通、关怀,企业文化越来越重要,社交应该是一个突破口。”
对于社交媒体为企业内部沟通、协作和创新带来的新机遇,技术商业思想大师唐·泰普斯科特也做过相关阐述,以企业内部的知识管理为例,他认为过去强调知识是一种有限的企业资产,并用隔离的方式管理知识的方式已经过时,如今更适合通过内容协作的方式,既不仅仅是把企业的知识都放在某一个地方集体获取,也不是通过查收关于一个项目的几十封邮件来掌握动向。
或许更好的方法是:在线建立一个项目小组,发起某个话题的讨论,然后争取各方意见,或者进行数字化的头脑风暴,在维基上与同事共同制作项目文档,然后通过微博将结果告知相关参与人。
在这方面,荣之联的思考是搭建企业级的微协同平台。丁洪震说:“我们整合了网盘、微信、微博、云笔记等流行的SNS系统,将移动BI、任务协同、项目管理、日程计划、移动门户也纳入其中,并和企业已有的CRM、ERP系统对接,这样就可以将协同由内部延伸到外部,由企业自有人员扩展到相关利益方,同时因为平台部署在企业内部,也就更加安全可控。”
对于使用微协同的业务场景他也做了详细描述:“企业的管理者可以将个人日程分享给家人,工作日程分享给同事,可以直接为下属员工分配任务,可以随时查看工作进度和状态。可以处理邮件,可以办理ERP的系统的审批,也可以将产品资料通过云盘共享给客户,可以把读书心得放到云笔记,也可以通过企业微博或企业微信和员工共享管理案例,可以利用随时查看财务报表,可以即时了解业务进展和竞争的对手动态。而这所有的一切都在一个系统内即可完成,并且完全支持手机和PAD。”
他补充道:“我们把互联网上好的东西跟企业的应用结合起来,然后糅合和到一起,对于传统软件企业来说,企业SNS要做的就是利用自己的既有优势,找到与SNS的结合点,这点说起来很容易,但真正实现起来很难。”
与丁洪震有类似这样想法的企业不少,据了解,金蝶、用友、北森等传统软件企业分别推出“云之家”、“企业社区”、Tita等产品,通过新产品与企业的核心ERP等系统进行整合,引导并推动企业员工使用,他们锁定的目标大多是大中型客户。
开往企业社交春天的列车
通过以上的分析,可以看出,企业社交的面孔不只一面,并不仅仅因为它对企业产生作用和效果不同,还因为不同的企业本身都是独立不同的个体,有自己核心的竞争力,无论是国外的IT巨头还是国内的传统软件公司,他们毫无疑问都带着企业级IT的“标签”,对从互联网发展而兴起的社交,多少有一些水土不服。从目前来看,社交的应用和市场布局不过是他们众多子标签的一个,毕竟主营业务、核心竞争力还不在此。
对此,从事投融资顾问的上海股中商务咨询有限公司副总裁李靖表示:“国外的企业工作方式更强调协作,这也解释了为什么Yammer在美国发起并得到了很好的应用,而在国内越大的企业越强调层级,强调组织结构,并不是扁平化的,那么社交能够起多大的作用?也许是建立更人性化的企业文化,也许是加强大家的交流,仅此而已,涉及核心的业务现在还不成熟。”
对于从事企业社交的公司实力,从资本和市场角度看,李靖会通过几方面指标做衡量:第一、该公司主攻客户群体的需求是否是刚性的,如果一个只有十几个人的小团队,为他们提供沟通的协作平台,需求是非常有限的,因为这类企业的员工见面交流就行了,销售业绩可能才是他们的痛点;第二、该公司的技术壁垒高不高,如果产品具有可复制性,也就是技术壁垒不高的话,那就要再考虑两个问题,一是市场蛋糕是否足够大,是否随便切一块儿就足够;另一个就是本土的市场能力是否够强,比如在国内,谷歌与百度是没法比的,如果两边都不强,夹缝中求生存,这类公司活下去就很难。这也是对新进企业社交领域公司的警示。
如此说来,这个市场很矛盾,一方面从用户的角度来看,大家急迫地需要社交的一些应用来解决工作问题,而从供应商的角度看,目前还缺少成熟的解决方案。这也是李靖走访多家公司所看到的市场现象。
丁洪震也反映很多用户觉得企业SNS理念非常好,但不知道应该怎么用。他说:“很多人都在玩微信,但把微信用在企业里面,并且用好的非常少,毕竟个人玩具不等于企业工具,这里面有技术的问题,有管理的惯性,有观念的转变,也牵扯到个人使用习惯的改变和工作方式的变化。整体而言,企业社交还处在前期的引导阶段”。
总结来说,对于企业社交的理解和应用,内涵是社会化,核心在于互动。置于公司内部的人,也是身处社会中的人,关注的重点不局限于内部,还要把企业的客户、渠道、最终用户都纳入到这个体系中来。而互动需要知识沉淀和知识分享,但这个还不够。最好的互动,不是显见的言语和文本交流,而是实践中的互动,与具体工作和业务绑定的互动,边干边学,边学边干,最后学和干融为一体,不仅构建的是一个交互体系,更是一个解决实际问题的业务体系,工作完成的同时,公司和员工的价值也随之提升。
另外,不少企业也在考虑社交与现在的云计算、大数据、移动互联网等技术应用如何结合,甚至与智慧城市做一些有效的整合。在这个过程中,社交更多的是起一个“剂”的作用,或者作为一个数据收集和获取的前端,在后端企业可以进行数据计算、分析,或指导企业的其他业务层做出相应的改变。这方面,传统的IT企业会更具优势,因为他们掌控的资源更具竞争力。因此,在企业级市场,社交能发挥什么力量,非常值得人们期待。
【关键词】台湾电影 大学生 认知 文化传播
2009年上映的《海角七号》一改台湾电影的低迷境况,使台湾电影重新进入公众视野,随着互联网的发展以及电影院线制播制度的与时俱进,大陆观众尤其是大学生群体可以看到更多的台湾电影。目前对两岸的影视文化传播研究较少,从青年角度探讨影视文化对于青年人认知台湾文化的更少。本文采用文本分析法和问卷调查法,以定量研究的方式来探究台湾电影对大陆大学生认知台湾,解读台湾文化方面的效度,以期获得有关在促进两岸文化传播方面的启示,进而更好地促进两岸的文化交流。问卷共有19道题,均为单选题,其中还涉及根据李科特五级量表设计的选择题。在调查中我们采取“滚雪球”的方式,共发放问卷240份,回收180份问卷,其中有效问卷为130份,有效率达72.2%。
本次的调查具体的样本结构如表1:
一、大学生观看台湾电影的总体形态
1、台湾电影接触情况比较
(1)是否看过台湾电影。在“是否看过台湾电影”的调查中发现,有78.5%的大学生表示“看过”,21.5%的大学生“没有”看过。可见,大学生对于台湾电影的接触率比较高。通过对性别做卡方检验发现:在0.05的显著性水平下,P=0.018
(2)看过的台湾电影。我们选取近十年10部台湾主流电影作为考察大学生对台湾电影了解情况的依据,2007年《不能说的秘密》有69.6%的大学生看过。但从真正意义上提升台湾电影在大陆的认可度的影片是2008年由魏德圣导演的《海角七号》,该片上映后一改台湾电影先前的颓废局势,同时也使大陆观众开始接触更多的台湾电影。调查的数据显示,有61.8%的大学生看过该片。《那些年,我们一起追的女孩》,大学生看过的比例高达81.4%。该片先是2011年底在网络上掀起一阵轰动,2012年年初登陆大陆院线,最终票房7580万,创下台湾电影在大陆最卖座纪录。①我们发现凡是在大陆做过较多宣传的影片,其观看率较高,如《不能说的秘密》,《海角七号》和《那些年,我们一起追过的女孩》。同性恋题材的青春电影《蓝色大门》有30.4%的大学生熟知。(见图1)
2、接触台湾电影的渠道
这里我们主要从获取台湾电影信息的渠道和观看台湾电影的渠道两个方面来研究。
(1)获取台湾电影信息的渠道。经统计发现,大学生选择“经常”使用某种渠道获取台湾电影信息的比例最高的是门户网站(26.2%),其次是“社交网站”(20%)。因此,在获取信息方面,传统媒体并不是主流,社交网站等社会化网站逐渐成为大学生获取各种信息的平台。(见图2)
(2)观看台湾电影的渠道。经调查发现,大学生观看台湾电影的最主要渠道是“网络”(有效百分比达77.8%),选择“电视”的比例为16.2%,电影院的比例仅为6.1%,这可能和台湾电影进入大陆院线市场的影片相对较少有关,致使电影院成为大陆大学生观看台湾电影最少选择的渠道。
就不同性别进行卡方检验发现:在0.05的显著性水平下,P=0.021
经卡方检验发现,不同年级、专业大学生观看电影渠道的情况在统计学意义上均没有显著差异(p值均大于0.05)。虽然不同年级的大学生在看电影的渠道选择上,依然是网络排在第一位,但是我们也注意到,大一和大三的学生通过电视观看台湾电影的比例明显高于其他年级的学生,均超过25%,而攻读硕士的大学生通过电影院观看台湾电影的比例最高,达25%,其他年级通过电影院观看台湾电影的比例几乎为0。由此可见,年龄层越高的大学生,依然保有传统的观影方式,而年龄层越低的大学生更偏爱使用新媒体作为观看电影的渠道。
二、大学生对台湾电影内容的认知比较
调查前的文献检索发现,对于台湾电影的研究多是文本分析,其中多是从台湾电影的青年形象传播、本土化、日本文化痕迹三方面的解读,因此本调查也围绕这三方面展开,以研究大学生对于台湾电影意象文化表达的认知与理解。
1、对台湾电影的整体印象认知
台湾电影的类型多种多样,不同的作品带给观众的感觉也有所不同。调查中发现,台湾电影给大学生最为深刻的印象是“清新”,“温暖”,两者选择“比较赞同”的比例均是52.9%,其次感觉很“文艺”——47.1%的大学生“比较赞同”,44.1%的大学生认同台湾电影有很浓郁的“本土”情结。部分台湾电影传达的“励志”和表现手法的“创意”性也得到约40%大陆大学生的认可。(见图3)综合比较“比较赞同”和“赞同”的比例发现,有38.3%的大学生认为台湾电影中表现的台湾“乡村文化保留较好”,而相比快速发展的现代经济,台湾电影中传播的“经济发达”形象相对较少,更多的是台湾原有的乡土传统气息。
2、对台湾电影的使用与满足情况
通过研究大陆大学生对观看台湾电影的使用与满足情况的比较来看,除“放松娱乐(均值为3.68)”和“可以看到喜欢的影片的导演或演员(均值为3.21)”外,大学生还偏好通过台湾电影来“感受台湾文化”(均值达3.48),因此,根据前文大学生78.5%的观影率来看,台湾电影可以作为台湾文化的传播者,透过台湾电影大学生会更多地了解台湾及其文化。(见图4)
研究受众需求时我们比较了看台湾电影前后,受众对台湾的了解有何变化。研究发现,大学生对“台湾的本土情怀”的了解增加最多(均值为2.2),其次依次是对“国语、闽南语及客家话并存的语言文化”(均值为2.1)、“本省人”“外省人”客家人为主的族群文化(1.89),以及“台湾人的日本情结”(1.74)的“了解有增加”。由此可见,台湾电影在很大程度上会影响大学生对于台湾文化的认知,特别是对台湾本土文化的了解上,台湾电影发挥了很大的作用。
3、对台湾电影中青年形象的认知比较
首先我们检测了“观看过”台湾电影的大学生对于台湾电影中青年形象的认知比较,发现其青年形象主要有三点(均值比较法):一是重义气(4.64),二是友爱互助(4.38),三是积极进取(4.21)。而对于“没有看过”台湾电影的大学生而言,台湾年轻人的形象主要是关心社会(4.64)、重义气(4.24)和积极进取(4)。电影中的青年形象和现实生活中的年轻人形象相比而言基本一致,即普遍比较重义气和友爱互助。
通过对“看过台湾电影”的不同性别大学生对于台湾电影青年形象的评价比较发现,男生对电影中的青年形象印象更为深刻,他们更多地认为台湾电影中的青年“叛逆张扬,迷茫堕落”。而对于“没看过”的大学生而言,女生眼湾青年更加的“不关心社会,叛逆迷茫”,而没看过台湾电影的男生则认为台湾青年是非常关心社会的。也就是说,看过台湾电影的大学生和没看过台湾电影的大学生相比,对于台湾青年人的印象略有不同,由此可见,台湾电影在影响大陆大学生对于台湾人的认知上存在一定的影响。
4、对台湾本土文化的认知比较
调查发现有73.1%的大学生认为“台湾电影中较多保留了中华文化元素”,同时,在比较日本元素和中国元素在台湾电影中的体现比重时,有50.8%的大学生认为“中国”元素保留的最多,而仅有15.4%的认为台湾影片中“日本元素”占很大比重。在分析为何“日本元素”会出现在台湾电影中时,有接近60%的大学生认为是“漫长的殖民史给台湾社会留下了不可磨灭的印记,电影反映社会现实的需要”。同时,有24%的大学生认为“两岸长期对立缺乏交往,日台关系亲密造成了这一现象”。我们进行更为深入的比较发现,选择“中华文化保存较多”的大学生同样有30.3%的比例认为“中国”因素在台湾的影响力很大,而这些受访者中也有30%认为台湾电影中的“日本”的影响力大。也就是说,日本殖民的遗留痕迹在台湾始终存在,这种历史的痕迹会在电影中呈现,而大学生对于中华文化和日本文化在台湾的存在性也有相应的认同,即台湾电影中展现的关于民族的文化元素与大陆大学生认知台湾上存在着一定的相关性。
三、结论与讨论
本研究的目的是为探寻大学生对于台湾文化的认知与台湾电影之间的关系。第一,大陆大学生认为台湾电影让人印象最为深刻的是电影的“清新”、“温暖”之感,这与他们对电影中“重义气”“友爱互助”“积极进取”的青年形象的感受基本一致,即都是非常积极正面的印象。第二,大学生比较认可台湾电影中展现的“乡村文化”,通过电影,大陆大学生同样认为台湾较好的保留了宝岛的乡村文化。第三,大陆学生观看台湾电影的主要动机符合影视传播的功能之一——放松心情,娱乐身心,这一需求的满足程度最高,其次大学生认为满意度相对较高的是“感受台湾文化”和“了解台湾的知识(历史、地理等)”。由此可见,大学生认为台湾电影是了解台湾文化的一种方式。因此,在放松娱乐的同时,大学生希望能借助台湾电影更多地了解台湾。研究还发现,观影后大学生更为丰富且深入地了解到台湾的文化。
电影作为一种传播媒介,它所传达的台湾文化符号和人物形象会影响到观众对于现实台湾的理解。人们会在心理上认为电影所表现的尽管有夸张的成分,但与现实的台湾依然存在一定的一致性。由此可见,电影的娱乐功能促使观众观看电影,被影片的意象影响,了解到可能原本并不知道的信息,进而改善或加深他们对现实生活的一些理解。因此,台湾电影的传播对促进两岸青年的文化交流有很大程度的影响,其意义不容忽视,有待进一步探究。
参考文献
①百度百科资料,《那些年,我们一起追的女孩》,http:///
view/2289329.htm.
关键词:存在感; 心理需求; 补偿行为; 社交退缩; 行为策略
中图分类号: B842.9文献标志码: A 文章编号:16720539(2016)06005507
一、引言
如今,“存在感”一词频繁出现于人们的生活中,娱乐明星、政治人物甚至商业产品等相关的时事新闻都难免被贴上“刷存在感”的标签。有研究者通过对网络小说页面设置的考察发现,网站首页书评区和互动信息区成为作者、读者寻找和制造存在感的途径[1]。在社交手段日益发达的今天,人们获得“存在感”的途径是各式各样的,面对面的交流虚拟工具、社区、论坛等都成为人们表达“存在”的一种工具。不可否认的是,通过“刷存在感”,人们往往可以获得外界的关注,满足自己的心理需要。
Goffman认为,现实情境中人们表达自己的“存在”的场所就是整个社会,而作为人们表达存在方式的人际互动则是一种“社会表演”[2]。根据戏剧理论(Dramaturgical theory),在表演开始前,人们首先会对所处的社会情境进行认识(情境定义),然后据此来选择演出舞台(演出舞台)并内化该情境中的社会规范和准则(表演框架)。最重要的“表演”过程,则是表演者按照表演框架的要求和一些常规程序(剧本)进行交互,同时通过言语、行为等策略来取得“观众”的认可(印象管理)的过程。这一理论强调了个体社会行为的互动性,包括熟悉情境中的持续性互动和陌生情境中的临时性互动。除了面对面的互动,该理论同样可以解释人们在网络人际互动中的表现。例如,个体在即时通讯工具(腾讯QQ)中标示的在线状态往往传达着一种自我存在的信号,而互动对方对这种存在的认同则影响前者的网络存在感[2]。
社会存在理论(Social presence theory)则针对虚拟情境提出了社会存在的概念,并将其定义为人与人在多媒体环境下互相关注的程度[3]。如果传播媒体能够在社会情感层面给予个体与面对面交谈一样的感受,个体就会产生被视为“真实的人”以及与他人相联系的心理感受,即体验到社会存在感。这一过程中,影响沟通双方社会存在感的两大因素分别是亲密性(Intimacy)和接近性(Immediacy),前者取决于沟通双方的物理距离、目光接触、微笑等亲密动作以及对话主题等因素,后者则指沟通过程中通过语言、表情体现出来的心理距离[4]。
戏剧理论从个体自身角度出发,描述了个体如何主动从互动对方那里获得“存在感”[2],社会存在理论则强调了沟通媒介如何影响沟通双方获得的“存在感”[4],二者强调了存在感的感知过程中自我的主动和对方的互动这两个因素的重要作用。这种人际互动中对自我存在的感知,可概括为自我存在感的社会交互模型(见图1)。自我主动表达的是个体对“自身存在于社会或群体”的感知需求,而对方的互动则体现了个体“让对方感知到我存在”的感知需求[5]。戏剧理论和社会存在理论可以解释现实生活和网络情境中“存在感”的产生过程,并且说明了这种“存在感”是基于社会交互而产生的一种个体心理体验。
图1存在感产生的社会交互模型
社会生活中与“存在感”相关的是“刷存在感”现象,说明个体会对“存在感”产生需求并为了满足这种需求而付诸行动[1],进而产生存在感体验、存在感体验失败两种不同结果。社会心理学认为,当与他人建立并保持人际关系或被团体接纳时,个体体验到社会接纳(Social acceptance),进而给其认知、情绪情感及行为带来积极影响[6]。反之,个体体验到社会排斥(Social exclusion),其情绪、认知会受到消极影响,甚至出现自我调节能力受损及更多攻击行为、行为等消极行为[7, 8]。但已有研究的结果尚不足以解释存在感体验和存在感体验失败的一些问题。首先,通过观察可发现,个体获得存在感体验时不一定存在明确的对象作为接纳自己的内群体,即个体在不参与交互的情况下自发地体验到存在感。这一差异说明存在感体验与社会接纳体验可能存在差异。其次,社会接纳和社会排斥中的一个重要影响因素就是个体的关系需求和归属需求,其满足与否影响着个体的心理体验及认知、行为反应[7, 9]。尽管个体“刷存在感”的行为是受需求驱使的,但这种需求的内涵具体是什么尚未明确,其与个体寻求社会接纳的动机有何异同同样不明确。再者,有研究发现社会排斥会激励个体进行人际关系重构(Interpersonal reconnection),被排斥的个体会更积极地与新的关系资源进行交流、互动,进而重建密切的互动关系[7, 9]。那么,存在感体验失败时,个体的心理、行为如何发生变化同样值得探讨。最后,按照戏剧理论,个体在社会交互行为中会采取印象管理策略[2],而社会接纳和社会排斥的相关研究则无法说明存在感的相关行为中是否会出现认知、行为的策略。
基于上述分析,研究着眼于社会生活中的“存在感”现象,采用扎根理论方法(Grounded theory method)对该现象进行更完善的分析[10],以更好地解读这一现象的含义及其特点。考虑到本研究涉及非人际互动领域的存在感现象,而已有研究方法不足以满足本研究的需要,故,在已有研究的基础上,本研究拟回答以下几个问题:(1)驱使个体追求存在感体验的需求的内涵;(2)个体获得“存在感”的途径;(3)个体未能体验到存在感时的心理、行为特点;(4)存在感相关行为是否涉及策略选择。
二、方法
(一)访谈对象
“刷存在感”现象最初出现在网络世界的年轻群体中,而后在现实生活中也广泛发生。为保证研究取样能够提供足够信息,本研究访谈对象要求有5年以上互联网使用经验且至少是3个论坛、虚拟社区的注册用户。按照目的性取样原则,选取了5名在校大学生参与了访谈。访谈对象平均年龄22.7岁,其中男性2名,女性3名;经常使用的论坛、虚拟社区平均数量为3.7个,平均使用年限为4.2年。
(二)访谈方法
研究拟定了一份包含3部分共18项的半结构式访谈提纲。访谈第一部分涉及现实交互情境中个体获得存在感的途径与过程;第二部分涉及个体在未参与交互时自发获得存在感的过程,例如当得知自己或所属的某一群体被表扬时;第三部分涉及虚拟情境中个体获得存在感的过程及其心理与行为特点。每组访谈开始前的1~2个问题为启动问题,引导访谈对象回忆相关情境。访谈过程中,研究者着重引导被访者报告其在不同情境中的经历与体验,收集情境、动机、感受及行为反应相关的信息。访谈时间为46~59分钟,所有内容在征得访谈对象同意后进行录音并转录成文本资料。
(三)研究工具
研究使用ATLAS.ti 6.2软件作为定性资料的分析工具,使用界面如图2所示。
三、分析
(一)开放式编码与主轴编码
为了对个案进行深入剖析,将每一个完整的表述指定为一个“句子索引”,将整个文本资料整理成索引目录。A为某高校在读硕士,有3个长期使用的网络交流工具,平均使用年限为3.3年。访谈文本A共整理出126个句子索引(编号001~126),通过开放式编码获得61个基层编码。由于访谈涉及不同情境,因此将按照访谈主题将开放式编码和主轴编码拆分为不同模块。
句子009~010展现了个体在现实交互情境中希望获得他人关注这一过程的心理与行为特点(见表1),句子107~112则展现了个体在虚拟交流中希望获得他人关注的心理与行为特点(见表2)。随着访谈文本分析的深入,大部分概念在访谈对象提及的其他案例中得到反复验证,例如008句、048句、116句再次出现了个体在现实或虚拟情境下希望获得他人不同形式关注的信息,由此得到“交互类型”、“交互对象”、“交互情境”三个范畴。此外,024句、036句、040句则发现个体在不同情境下不仅希望能够获得他人关注,同时还希望在某些交流主题上获得他人的认同。前者是一种与他人保持频繁、积极、稳定联系的需求,后者则是希望被接纳或认同的需求[6],由此得到“关系需求”和“归属需求”两个范畴。以同样的方式对全部文本进行开放式编码和主轴编码,得到的主要概念和主要范畴见表3。
表1现实交互中关系需求来源
句子索引数据及分析备注
009010Q:交流讨论中你发表意见后,期待别人做出怎样的反应?
A:这个看不同的场合(场合)吧,和什么话题(话题)吧。可能有些比较轻松,生活中一些比较无所谓的话,我不会期待别人给我一个什么样的回复。但是带有目的的事务(目的性事务),我可能会期待别人给我一定的回复(期待回复)。不管是好或者坏,你最好能给我提点建议。不要说太空洞的话,给我一点实质性的建议就可以了(实质性建议)。开放式编码
句子分析备忘录:
009~010句可提取的概念:场合、话题、目的性事务、期待回复、无论回复好坏、实质性建议:
1. 场合指交流发生的特定情境,例如时间、地点等。
思维过程:个体希望获得回复、关注的这种需求是依交流情境而变化的,在某些特定的情境中会产生这种需求,而在另一些情境中则不会产生这一需求。概念内涵思考与推理
2. 话题指双方交流的内容、主题等,例如后文所提及的“目的性事务”就是其中一种。
思维过程:个体希望获得回复、关注的这种需求是针对不同事件、任务的,对于某些目的性事务需要相关人物给予关注甚至参与进来,而对于某些不太重要的事情则不是这种获得关注的需求的必要条件。
概念内涵思考与推理
3. 期待回复指个体产生一种明确、外显的获得关注的需求。
思维过程:个体期待对方给予回复的前提是个体的信息获得对方的关注,因此期待回复实质上则是一种个体获得对方关注的需求。概念内涵思考与推理
4. 实质性建议指他人提供的、对问题解决有帮助作用的想法、意见等。
思维过程:个体不仅希望对方能够关注到自己相关的信息,同时希望对方能够在自己的问题解决上建言献策,由此推断这是一种任务导向的关注需求。概念内涵思考与推理
(二)选择式编码
通过对原始资料、概念、范畴的不断比较,可以提炼出更高层次、更抽象的核心范畴并围绕核心概念建立相关的关系网络。ATLAS.ti软件中核心概念的关系网络以结构图的形式呈现出来,同时可以简易地表示范畴之间的关系。
结构一:依据“交互类型”、“交互对象”、“交互情境”、“关系需求”和“归属需求”五个范畴提炼出“存在感需求”这一核心概念及其概念网络(见图3)。存在感需求包含关系需求和归属需求,而交互类型、交互对象、交互情境则影响着存在感需求的产生。
107108112Q:你在哪些情况下会去主动回复别人?当时是怎样想的?
A:一个亲疏状态吧(亲疏状态),就是我们俩关系是不是很好(人际关系)。还有一个就是你感不感兴趣(兴趣)。还有就是很好的朋友啊(朋友),比如别人“生日快乐”呀,祝福一下人家。可能就是别人很开心的事情,你也可能会去祝福一下。再就是好关系的吧,不痛不痒的我一般不会去回复。然后就是,有些人很难过,你可能会去……
A:还有一种是可以像其他人学习啊,比如说,他发了一个好东西,唉,我觉得还不错,可以教我之类的(学习榜样)。还有一种你可能是出于增进和某人的关系,那可能我会比较关注他的QQ状态。就是点个赞啊,就是……保持交流嘛,这也算是一种目的吧(保持联系)。开放式编码
句子分析备忘录:
107~112句可提取的概念:亲疏状态、人际关系、兴趣、朋友、学习榜样、保持联系;
1. 亲疏状态指个体与交流对方的心理距离,表现为亲近和疏远。
思维过程:个体在虚拟社区中是否主动回复对方取决于与对方的心理距离,即个体希望与亲近他人建立交流与联系,而关系疏远的他人则不会成为建立联系的选择。概念内涵思考与推理
2. 人际关系指个体与交流对方建立的关系质量,亦即个体与对方的心理距离。概念内涵
3. 兴趣指交互过程中个体希望深入了解、加入或参与的程度。
思维过程:个体是否与他人建立联系取决于双方的心理距离,而这种联系是否符合个体的兴趣则可能影响其质量、持续时间,进而也就决定个体是否希望在当前主题上获得对方的深切关注。概念内涵思考与推理
4. 朋友指与个体有共同兴趣或共同经历的重要他人。
思维过程:朋友间存在共同的价值观或相近的思维方式,有利于双方的互相理解和帮助,而获得朋友的关注不仅有利于个体当前问题的解决,也能够促进双方人际联接的强化。概念内涵思考与推理
5. 学习榜样指在交互主体上能够帮助个体进步、获得技能的他人,例如学长、老师等。
思维过程:个体同样希望能够获得对自己能够有所帮助的他人的关注,这种关注的获得将影响个体预期问题的解决,因此也是一种任务导向的关注需求。概念内涵思考与推理
6. 保持联系指个体维持与他人联接的长期存在,包括朋友、新认识的人等等。
思维过程:个体通过获得他人关注的方式在双方之间建立并维持人际联接,而这种人际关系又不是针对个体当前遇到的或预期困难的,因此可理解为关系导向型的关注需求。概念内涵思考与推理
结构二:文本分析同时发现了个体无法获得存在感时的心理、行为表现。此时,个体的情绪特点可提取出范畴“消极体验”。但在面临存在感体验失败时,个体在不同的条件下(即交互类型、交互对象、交互情境)会表现出两类行为――“社交退缩”(例如36句、46句、77~80句)和“补偿型存在感”(例如16句、24句、82~86句)。补偿型存在感指个体通过再次提问、转移对方注意、主动插话、参与群体新话题等方式补偿之前缺失的存在感。与此同时,29~36句显示个体还会改变交流方式即进行“策略转变”。这一部分分析可提炼出“存在感体验失败”这一核心概念(见图4)。
结构三:访谈第二部分涉及个体在未参与交互时也能自发获得自我存在感的过程,包括个体自身或其所属某一群体被讨论、表扬等情境。通过对该部分的文本资料进行编码分析,提取出“自发型存在感”这一范畴,并且当个体本身或其所属某一群体被表扬、讨论时都有可能诱发个体的存在感。此外,通过对007~012句、92句、107~114句进行编码分析发现,个体通过主动参与交流、分享经历、表达自己的群体成员身份等途径主动建构存在感,故提取出“主动型存在感”这一范畴。此外,008句、126句则显示主动型存在感产生过程中,个体会采取一些印象管理策略,例如“不明确反对他人观点”、“避免他人的高度关注”等。因此,这些分析可提炼出“存在感体验”这一核心范畴(见图5)。
(三)多个案分析
按照扎根理论方法的理论性抽样(theoretical sampling)原则[10],利用个案研究的初步结果,继续进行更深层次的多个个案分析,对个案分析的结论进行验证和补充。首先,通过对全部5个个案的扎根理论分析发现:(1) 存在感需求这一核心概念网络得到了验证;(2) “自发型存在感”、“主动型存在感”、“补偿型存在感”得到了验证。(3) 存在感缺失的关系网络也得到了验证。其次,部分范畴的内涵及其相互关联得到了扩展:(1) 个体通过群体途径产生自发型存在感,是以自我与群体的强烈联接为前提的。(2) 在自发型存在感较弱时,个体同样会采用一些强化策略(例如,主动公开匿名或群体成员身份)来确定这种存在感,此时自发型存在感就转变为主动型存在感。此外,补偿型存在感产生过程中,个体同样会采取印象管理策略。因此,个体使用的各种策略可以进一步提炼出“策略使用”这一范畴(见表3)。(3) 存在感体验失败时,个体体验到消极情绪的同时还会发生态度转变,即对导致其存在感获得失败的人、情境的态度更加消极。但在获得存在感时,则未发现积极态度转变。结合多个个案分析结果,得到关于“存在感需求-存在感体验-存在感体验失败”的总体概念模型(见图6)。
四、讨论与展望
(一)研究总结
本研究着眼于社会生活中的“存在感”、“刷存在感”现象,通过访谈方法对这一现象的形成、发展过程及其导致的心理、行为反应进行了探索。由于目前尚无研究对存在感的内涵进行阐明,本研究采用了扎根理论方法对其内涵、特征及其产生过程进行了分析。
首先,本研究在访谈过程中对存在感体验和存在感体验失败均有所关注,而这两方面的发现则可以相互佐证。一方面,本研究通过多个个案分析发现,个体在关系需求和归属需求的作用下获得存在感时表现出开心、尊重、人际满足等积极体验(访谈的开放式编码所得),说明存在感体验与社会接纳引发的心理体验有相似之处[6]。另一方面,实证研究则已证实社会排斥会引起消极情绪,并且被排斥者会给予排斥源更消极的评价[11]。本研究同样发现未能获得存在感时,个体不仅会体验到消极情绪,还会产生相应的消极态度。需要强调的是,这种态度的变化仅限于存在感体验失败时,对于存在感体验获得时,本研究没有发现态度的积极变化。
其次,本研究按照产生途径对个体感受到的存在感类型进行了不同划分。第一,本研究发现个体在某些情境下可以自发产生存在感,例如当自己本人、自己的意见、事迹被他人赞扬或被重要的其他人讨论时,个体都会体验到积极情绪。这与群体交互中个体获得社会接纳的机制又是不同的,说明存在感现象又并非完全等同于社会接纳现象。第二,当个体所属的群体被他人称赞时,个体同样会自发地体验到存在感及相应的积极情绪。群体的存在感则成为个体存在感的间接途径,而个体与群体的联接强度则影响着个体从中获得存在感的强度。这一发现可能与个体对不同群体的认同差异有关,内群体认同越强,则个体受到内群体的影响越大[12]。第三,本研究发现在存在感体验失败时,个体可能会转变策略并采取新的行为来重新获得存在感,例如积极加入新的群体话题。值得注意的是,这种补偿型存在感同样是在需求驱动下的行为,但其产生机制又不同于主动型存在感。第四,本研究发现个体在特定情境下会采取主动策略来确立存在感,例如主动分享经历、插话等。而在自发型存在感产生以后也会采取策略来强化该体验,例如主动公开匿名或成员身份。这些现象便是日常生活中所谓的“刷存在感”,通过这种方式,个体获得存在感需求的满足,进而导致交互活动的增加。
最后,本研究同样发现了一些存在感需求产生机制的特点,这些发现同样符合以往关于社会交互行为的研究结果。第一,本研究发现情境、对象和交互主题影响了个体存在感需求的产生,这一点与戏剧理论关于“情境定义”、“演出舞台”的观点一致[2],同时也与社会存在理论关于“社会情境”、“交互”、“接近性”等的观点相吻合[4]。第二,本研究发现在个体主动建立存在感或补偿之前未获得的存在感时,会采取印象管理策略、策略转变等行为策略来获得外界的积极关注与认同,这与戏剧理论关于“表演框架”、“剧本”、“印象管理”的描述一致[2]。第三,本研究发现存在感体验失败时,个体除了采取补偿行为外,还有可能采取社交退缩行为,同时可能伴随消极态度的产生。按照社会排斥的需求-威胁模型(Need-threat model)[13],当关系需求(包括归属感和自尊)受到更大威胁时,个体会表现出对社会关系重建的强烈兴趣以及更多的亲社会行为倾向,而当效能需求(包括控制感和意义感)受到更大威胁时个体会通过行为或降低亲社会行为意愿来增强控制感[9, 14]。但不同的是,亲社会行为意愿的降低还受到了交互情境、对象和主题的影响,并且这种影响是通过存在感需求的间接作用实现的。
(二)研究展望
由于涉及现实交互、虚拟交流以及自身不在场的情境下个体产生存在感的过程,本研究在以往研究结果的基础上也获得了一些新的发现。但与此同时,本研究对现实社会中“存在感”现象的研究仍有值得深入的地方。第一,由于本研究是使用扎根理论方法进行的定性研究,研究获得的存在感概念的结构及其稳定性尚需要定量研究的进一步检验。第二,本研究认为“存在感”体验与社会接纳心理相似,但其产生途径说明个体不仅能够通过主动行为获得存在感,同时还可能自发地获得存在感。因此,这一自发型存在感体验与社会接纳心理有何异同则需要更深一步地探讨。第三,本研究依据目的性抽样的原则选取了具备一定现实和虚拟社交网络的高校学生为研究对象,由此造成访谈对象层次单一的缺陷,使得本研究可能无法解决另一些问题。例如,在现实或虚拟的其中一种环境中的存在感体验失败,是否会促进个体在另一种环境中的存在感补偿行为。第四,同社会接纳及社会排斥类似,存在感体验、存在感体验失败作为个体社会交互的心理体验,是否会影响个体的社会交互质量及心理健康也可以进行探讨,例如外显自尊、人际关系满意度、感知的社会支持及人际公平感,等等。
参考文献:
[1]王小英. 寻找存在感与制造存在感――网络小说链文本中的符号身份认同[J]. 中南大学学报(社会科学版), 2014, 20(6): 299-306.
[2]李许单. 我QQ,故我存在[J]. 太原师范学院学报(社会科学版), 2011, 10(3): 33-35.
[3]Tu C. The relationship between social presence and online privacy[J]. The Internet and Higher Education, 2002, 5(4): 293-318.
[4]徐琦. 浅析虚拟环境下的社会存在感理论[J]. 中国教育技术装备, 22008, 4: 18-19.
[5]李肖锋,王倩,张龙革.虚拟学习社区中社会存在感的影响因素研究[J].开放教育研究,2012,18(6):87-94.
[6]李霞, 朱晓颖, 李文虎. 归属需要的研究进展[J]. 心理学探新, 2010, 30(2): 86-90.
[7]Knowles ML, Green A, Weidel A. Social rejection biases estimates of interpersonal distance[J]. Social Psychological And Personality Science, 2014, 5(2): 158-167.
[8]杜建政, 夏冰丽. 心理学视野中的社会排斥[J]. 心理科学进展, 2008, 16(6): 981-986.
[9]王紫薇, 涂平. 社会排斥情境下自我关注变化的性别差异[J]. 心理科学进展, 2014, 24(11): 1782-1792.
[10]孟娟. 心理学扎根理论研究方法[J]. 吉首大学学报(社会科学版), 2008, 29(3): 170-176.
[11]Buckley K,Winkel R,Leary M.Reactions to acceptance and rejection:Effects of level and sequence of relational evaluation[J].Journal of Experimental Social Psychology,2004,40(1):14-28.
[12]石伟,闫现洋,刘杰.对不公正历史事件的情绪反应――群体内疚[J].心理科学进展,2011,19(2),224-232.
关键词:跨语言;知识管理;MOOC;文本挖掘
G40-057
大型开放式网络课程(MOOC)自2011年上线以来就倍受人们瞩目,它在时间和空间上拓展了教育的范围,教学形式较为新颖,对学习者来说,MOOC可以激发他们的求知欲、学习积极性和自主性[1]。MOOC的优势在于便捷和开放,能提供课程的相关学习资源,如讲义、笔记、学习小组、论坛等。还有一些英语课程配备了中文字幕,可以帮助中国学习者进行学习。这些在一定程度上提高了学习者的学习效率,促使学习者更快融入在线学习中,最后完成整个课程。
但是我们发现,在线学习也存在一些不完善的地方。以学习资源中的笔记为例,笔记通常按照记录时间顺序显示,还存在着很多与课程内容无关的信息,这导致学习者不能查看某个知识点对应的笔记,还会被无关信息打扰。而且课程中的中英文知识点之间的关联也不能体现。为了改进这些情况,让MOOC平台为学习者提供更好的用户体验,本文研究了如何通过文本挖掘技术和跨语言知识库的构建,管理MOOC学习资源中的知识。
一、研究现状和关键技术
1.跨语言知识管理
WordNet是由美国普林斯顿大学开发的大规模的汇总英语词汇知识的在线资源库。它是一个由普通的词典内容与计算机科学、心理学成功结合的基于认知语言学的词典,主要按照词汇的意义而不是字母顺序而组成的“词汇网络”[2]。经过20年的研究工作的进展,WordNet已经发展成为国际上非常有影响的英语词汇知识库,为知识管理做出了卓越的贡献。近年来,随着单一语言知识库的飞速发展和各语言信息多样性的增加,跨语言知识管理以及规模性跨语言知识库的建设将成为必然的趋势,具有研究价值。UKC (Universal Knowledge Core) 就是这样一个典型例子。
UKC是一个由意大利特伦托大学开发的扩展的多语种版的WordNet,包括几十万个概念。UKC扮演的角色是世界上所有的自然语言的中心枢纽,对于每种语言,都存在一个独立的LKC (Local Knowledge Core)。每个LKC都有一个源语言(目前为英文)和一个目标语言(世界上任何一种语言),可以独立发展并且与UKC同步。事实上,LKC是一个本土化进程,通过UKC,所有LKC可以均衡协作、互相使用,多种语言可以得到匹配。
UKC的基本组成部分是词语,义项,同义词集和概念[3]。它们的含义如下:同义词集是一组拥有一个共有的含义的词语;概念是可以表示一个同义词集含义的一句描述性质的话;义项是一个词语的含义;注释是一个同义词集的简短描述。此外,UKC中还有词目和词性这两个
元素。
2.关键技术
近半个世纪以来,随着计算机技术的成熟与发展,人们的生活中大量产生着社交媒体中的文本数据、通讯数据、GPS位置信息、传感器数据甚至还有图片和视频,信息的种类和数量有了爆炸式的增加。但是人们目前面临的严峻的问题是数据丰富而信息贫乏,只是把海量数据存储起来并不会带来任何价值,还需要对其进行分析,并从中获得有用的信息[10]。数据分析基本上都经历了数据获取、预处理(清洗)、选择分析算法、展示结果、评估这一流程。本文的研究基于文本数据的处理与分析,包括文本数据的获取、清洗、信息挖掘和数据可视化。
获取数据是数据挖掘的初始步骤。对分析者而言,外部数据比内部数据更容易获取,获取外部数据可以通过搜索引擎、开放数据、在聚合数据平台上购买或下载专业数据集、网络爬虫、调查问卷等方式。目前应用较多的外部数据的采集方式的主要有两种:商业化工具与网络爬虫,我们的研究就基于Python爬虫程序来获取网络课程的笔记。
文本挖掘是数据挖掘的一个分支,也是一个由机器学习、统计学、数学、自然语言处理等多种学科交叉而成的领域。顾名思义,就是从大量文本数据中抽取隐含的、未知、可能有用的信息,并对这些数据进行分析,挖掘其中潜在的知识信息[4]。文本挖掘的数据主要是指非结构化文档和邮件、网页内容等半结构化数据,常见的算法有关联规则算法,聚类算法 和分类算法。
数据可视化是指将身居分析的结果以图形或表格的形式展现出来,以便进一步分析和报告数据的特征以及数据之间的关系。它的首要任务是准确地展示和传达数据所包含的信息,并用直观、容易理解和操纵的方式呈现出来。它的基本流程是:⑿畔⒂成涑煽墒有问剑选择合适的图表,删去不突出的对象或属性,最终呈现出关键属性的明显特征。
二、跨语言知识管理的应用
我们研究的数据来自网易公开课中斯坦福大学开设的计算机系课程《机器学习》。首先使用Python爬虫程序获取最优笔记内容作为实验数据,然后用R语言分析文本数据、提取关键词,模仿UKC构建跨语言知识库,最后实现学习课程时对感兴趣的知识点的查询功能。跨语言知识管理研究的流程如图1所示。
数据获取与关键知识点提取
首先,利用编写的Python爬虫程序从网易公开课的课程页面获取前30页最优笔记,获得的数据保存成文本格式。
关键知识点提取是研究的核心部分,是文本分析算法的具体实现部分,此部分使用R语言完成,步骤如下:
第一步:读入待处理的文件,对数据进行清理和格式转换之后,经过排序,得到了共380条可用的笔记;
第二步:由于课程讲授是具有连续性的,而且为了方便统计,这里人为地将笔记按每3分钟为一段进行分段统计。然后对文本进行分词,然后全部去除文本中包含的标点、数字、多余的空格和停用词,生成语料库;
第三步:生成词汇文档矩阵,行为词汇,列为文档,使用tf-idf算法计算每个词语的权重,用余弦相似度算法计算出段之间的距离,对数据进行层次聚类,得到图2所示的聚类图。
由图可见,有一些类聚合效果比较好,如{5,6,7},{10,11,16,17,18}等。下面以{16,17,18}为例,提取这个时间段内的关键词。提取关键词的方法是统计词频,因为词频能在一定程度上反映词语在文本中的重要性,一般越重要的词语,在文本中出现的次数就会越多。{16,17,18}这一类代表的时间是45~53分钟,下面就单独抽取这一时间段的最优笔记,统计词频,得到图3。
我们可以断定{16,17,18}代表的笔记数据中,“梯度下降”,“算法”,“随机”,“descent”,“gradient”,“数据”这几个词出现的频率最高,结合机器学习的知识背景,可以得到这样的结论:45~53分钟,课程的主要知识点是“随机梯度下降”。同理,可以采取同样的方法分析出聚类结果里其他类的知识点,如下表所示:
三、结语
随着MOOC在世界范围内兴起与壮大,毋庸置疑,网络教育资源将成为未来自主学习者获取知识的重要途径之一,关于网络学习资源中跨语言知识管理的研究是很有实用价值和研究意义的。本文以学习笔记为例,设计了一个关键知识点提取模型并构造了跨语言知识库,实现了知识点的跨语言查询和最优笔记推荐。下一步我们将改进层次聚类的算法,加深研究深度,进行基于开放数据的跨语言教育资源共享平台的构建。
参考文献:
[1] 中国教育信息化网. 教育部关于加强高等学校在线开放课程建设应用与管理的意见[J]. 中华人民共和国国务院公报, 2015(18):48-50.
[2] 宗成庆.统计自然语言处理(第2版)[M].北京:清华大学出版社,2013:68-69.
[3] Ganbold A, Farazi F, Reyad M, et al. Managing language diversity across cultures: The english-mongolian case study[J]. International Journal on Advances in Life Sciences, 2014, 6(3):167-176.