时间:2023-06-04 09:21:13
导语:在人工智能的投资逻辑的撰写旅程中,学习并吸收他人佳作的精髓是一条宝贵的路径,好期刊汇集了九篇优秀范文,愿这些内容能够启发您的创作灵感,引领您探索更多的创作可能。
未来十年,世界上50%的工作,都会被人工智能所取代,尤其是助理、翻译、保安、边防、前台……今天的人脸识别在有些场景比人精确20倍。一个个领域,人都会被机器超越,不只是取代。
机器超越人已不再遥远
从识别、感知、认知,到做决策、反馈,人工智能在过去五年有非常大的进步。博弈的例子有AlphaGO,感知的例子有微软小冰,决策的例子有Google Gmail的自动回复。
我在30多年前就做人工智能,可惜,无论对弈、语音识别、自然语言理解都没有生逢其时。因为当时机器不够快,数据不够多,算法不够先进。但是今天,它们够先进了。
机器学习最重要的一个突破是深度学习。深度学习,就是用非常大的神经元,用巨量的数据充进去训练。它可以在识别、分类或者预测方面,远远超过任何过去的算法。这个学习的算法特别适合巨大的数据量。
什么情况才能用人工智能?人工智能不是万能的,但满足以下条件,人工智能绝对可以做出特别有价值的产品:千万级别的海量数据;顶尖的科学家;非常清晰领域的边界;非常好的标注;非常多的计算量。
很多人说人工智能好遥远。其实不是,百度、淘宝、滴滴的背后都是一个人工智能引擎。一些过去认为比较遥远的,如图像识别、语音识别的比赛,机器已经超越人了。
人工智能的应用领域
一个创业公司的用户达到了千万级别的时候,肯定需要人工智能引擎。因为系统需要做一些判断和推荐:推荐什么商品给用户,该放什么样的广告。所以,做人工智能创业的,最好是已经有互联网数据的公司。
当然,还有很多公司是没有互联网数据的,这些公司也能创造价值。
哪些领域会最先呢?一定是数据最大、最快能产生价值的领域。如金融领域:银行、保险、券商、智能投库、AI量化基金,是最快能产生价值的。
哪些是对人类最有意义的?一定是医疗领域。癌症的检测、切片,基因个性化的治疗。
最大的一个领域应该是无人驾驶。当电动车、共享经济、无人驾驶三件事情同时发生的时候,人类经济会产生最大的提升和改变。以后我们出去打车,应该是随叫随到,人都不需要买车了,停车场也不需要了,路上的车也变少了,空气也变好了,这些都是一些会发生的很好的“副作用”。
最厉害的AI公司将是Google。当Google搜索里面的引擎被提炼出来成为一个Google大脑的时候,用在互联网领域就变成了Gmail的自动回复,变成了Google的搜索和广告;用在汽车领域就是GoogleCar;用在人的健康领域就成了GoogleHealth;用在围棋上就是AlphaGO。
百度大脑也是一个类似的项目。每个伟大的互联网公司都应该考虑:拥有大数据是不是也应该像Google一样,用更多的深度学习创造商业价值?
中国有特殊机会
当你要做人工智能的时候,我有几个建议:要有特别大的数据,最好是闭环的,只有你有,别人没有;要买很多机器,尤其考虑GPU;要有经验丰富的深度学习专家;最后要把年轻人训练起来。
为什么特别提到训练年轻人呢?因为一个优秀的数学和计算机专业毕业生,培训6个月就可以做人工智能工程师了。
因此,最领先的人工智能国家,当然是技术最领先的、论文最领先的、应用最领先的,而且也是年轻人最上进、最努力、最勤奋的国家。
中国有一些很特殊的机会。中国教育特别重视优秀的理工、数学底子,世界上的人工智能论文43%都是中国人写的。中国传统企业比美国落后,但这表示人工智能注入进去就会产生很大价值。在座每一个潜在的独角兽公司和快到独角兽的公司,如美图、知乎、BRPK,都在快速的招人工智能专家,帮他们提升价值。美国领先的公司,无论是Google、坦斯福罗,还是微软、CNTK、Facebook,在中国都很难本土化,这都是中国公司的机会。
人工智能时代的投资蓝图
创新工场在人工智能时代的投资蓝图包括以下几个方面。
大数据公司。谁有大数据,我们就可以做人工智能。
R别。语音、手势、人脸等识别会有很大的突破,但是自然语言的理解,即语义方面的突破,可能还需要5-10年。
传感器。传感器现在很贵, Google做辆车要几十万美元,但我深信三年以后价格就会降下来。所以,我们更愿意投资那些现在看起来很贵,但一旦量产价格就会降下来的公司。
家庭机器人。家庭机器人长的像人的,恐怕还需要近十年的时间。但是,一些智能音箱、工业商业的应用,可以快速发展起来。
无人驾驶。无人驾驶一定是先开始辅助人驾驶,然后人来辅助机器,最后才能达到全天候的驾驶。
我们投资的人工智能项目,比较著名的是FACE++,还有地平线机器人、小鱼在家、金融界的人工智能第四范式,以及玉石科技的无人车,它已经开始在园区里面上路测试了,连驾驶盘都没有,所以完全是无人驾驶的工作。
我们深信,十年以后回顾人类历史,人工智能不只是一个创业的机会,也绝不仅是一个移动互联网之后最好的创业机会,而会被认为是人类有史以来最好的创业、创新机会,对人类有潜在的巨大改变,对人类生活有最大提升的一种技术。(本文摘自李开复12月6日在WISE-2016独角兽大会上的演讲,有删改,标题为编者所加,未经本人确认。)
一周视点
李开新
360手机执行副总裁2017年不折腾
作为初创企业和新品牌,稳和好要比高和快更重要。天道酬勤,只要不折腾,有正确的方向和明确的定位,企业总归会成功的。
12月5日,360手机新掌门李开新接受媒体采访时表示,2017年的思路是稳健运营,不折腾,不去做一夜暴富的梦,认认真真专心做手机。
古永锵
优酷创始人、阿里文娱战略投资主席融合、链接是未来关键
用两个词来形容我看到的未来:融合和链接。抢用户、圈地这种逻辑在新的十年越来越难,但如何使融合和链接产生增值是企业需要考虑的关键。
12月6日,古永锵在WISE-2016独角兽大会演讲中说,未来是融合的时代,也是全球互联网的时代。文化娱乐将是一个重要风口,产生很多创业机会。
唐沐
小米影业总裁、小米VR总经理小米VR“铁人三项”
1机械电子工程
1.1机械电子工程的发展史
20世纪是科学发展最辉煌的时期,各类学科相互渗透、相辅相成,机械电子工程学科也在这一时期应运而生,它是由机械工程与电子工程、信息工程、智能技术、管理技术相结合而成的新的理论体系和发展领域。随着科学技术的不断发展,机械电子工程也变的日益复杂。
机械电子工程的发展可以分为3个阶段:第一阶段是以手工加工为主要生产力的萌芽阶段,这一时期生产力低下,人力资源的匮乏严重制约了生产力的发展,科学家们不得不穷极思变,引导了机械工业的发展。第二阶段则是以流水线生产为标志的标准件生产阶段,这种生产模式极大程度上提高了生产力,大批量的生产开始涌现,但是由于对标准件的要求较高,导致生产缺乏灵活性,不能适应不断变化的社会需求。第三阶段就是现在我们常见的现代机械电子产业阶段,现代社会生活节奏快,亟需灵活性强、适应性强、转产周期短、产品质量高的高科技生产方式,而以机械电子工程为核心的柔性制造系统正是这一阶段的产物。柔性制造系统由加工、物流、信息流三大系统组合而成,可以在加工自动化的基础之上实现物料流和信息流的自动化。
1.2机械电子工程的特点
机械电子工程是机械工程与电子技术的有效结合,两者之间不仅有物理上的动力连结,还有功能上的信息连结,并且还包含了能够智能化的处理所有机械电子信息的计算机系统。机械电子工程与传统的机械工程相比具有其独特的特点:
1)设计上的不同。机械电子工程并非是一门独立学科,而是一种包含有各类学科精华的综合性学科。在设计时,以机械工程、电子工程和计算机技术为核心的机械电子工程会依据系统配置和目标的不同结合其他技术,如:管理技术、生产加工技术、制造技术等。工程师在设计时将利用自顶向下的策略使得各模块紧密结合,以完成设计;2)产品特征不同。机械电子产品的结构相对简单,没有过多的运动部件或元件。它的内部结构极为复杂,但却缩小了物理体积,抛弃了传统的笨重型机械面貌,但却提高了产品性能。
机械电子工程的未来属于那些懂得运用各种先进的科学技术优化机械工程与电子技术之间联系的人,在实际应用当中,优化两者之间的联系代表了生产力的革新,人工智能的发展使得这一想法变成可能。
2人工智能
2.1人工智能的定义
人工智能是一门综合了控制论、信息论、计算机科学、神经生理学、心理学、语言学、哲学等多门学科的交叉学科,是21世纪最伟大的三大学科之一。尼尔逊教授将人工智能定义为:人工智能是关于怎样表示知识和怎样获得知识并使用知识的科学。温斯顿教授则认为:人工智能就是研究如何使计算机去做过去只有人才能做的智能工作。至今为止,人工智能仍没有一个统一的定义,笔者认为,人工智能是研究通过计算机延伸、扩展、模拟人的智能的一门科学技术。
2.2人工智能的发展史
2.2.1萌芽阶段
17世纪的法国科学家B.Pascal发明了世界上第一部能进行机械加法的计算器轰动世界,从此之后,世界各国的科学家们开始热衷于完善这一计算器,直到冯诺依曼发明第一台计算机。人工智能在这一时期发展缓慢,但是却积累了丰富的实践经验,为下一阶段的发展奠定了坚实的基础。
2.2.2第一个发展阶段
在1956年举办的“侃谈会”上,美国人第一次使用了“人工智能”这一术语,从而引领了人工智能第一个兴旺发展时期。这一阶段的人工智能主要以翻译、证明、博弈等为主要研究任务,取得了一系列的科技成就,LISP语言就是这一阶段的佼佼者。人工智能在这一阶段的飞速发展使人们相信只要通过科学研究就可以总结人类的逻辑思维方式并创造一个万能的机器进行模仿。
2.2.3挫折阶段
60年代中至70年代初期,当人们深入研究人工智能的工作机理后却发现,用机器模仿人类的思维是一件非常困难的事,许多科学发现并未逃离出简单映射的方法,更无逻辑思维可言。但是,仍有许多科学家前赴后继的进行着科学创新,在自然语言理解、计算机视觉、机器人、专家系统等方面取得了卓尔有效的成就。1972年,法国科学家发现了Prolog语言,成为继LISP语言之后的最主要的人工智能语言。
2.2.4第二个发展阶段
以1977年第五届国际人工智能联合会议为转折点,人工智能进入到以知识为基础的发展阶段,知识工程很快渗透于人工智能的各个领域,并促使人工智能走向实际应用。不久之后,人工智能在商业化道路上取得了卓越的成就,展示出了顽强的生命力与广阔的应用前景,在不确定推理、分布式人工智能、常识性知识表示方式等关键性技术问题和专家系统、计算机视觉、自然语言理解、智能机器人等实际应用问题上取得了长足的发展。
2.2.5平稳发展阶段
由于国际互联网技术的普及,人工智能逐渐由单个主体向分布式主体方向发展,直到今天,人工智能已经演变的复杂而实用,可以面向多个智能主体的多个目标进行求解。
3人工智能在机械电子工程中的应用
物质和信息是人类社会发展的最根源的两大因素,在人类社会初期,由于生产力水平低,人类社会以物质为首要基础,仅靠“结绳记事”的方法传递信息,但随着社会生产力的不断发展,信息的重要性不断被人们发现,文字成为传递信息最理想的途径,最近五十年间,网络的普及给信息传递带来了新的生命,人类进入到了信息社会,而信息社会的发展离不开人工智能技术的发展。不论是模型的建立与控制,还是故障诊断,人工智能在机械电子工程当中都起着处理信息的作用。
由于机械电子系统与生倶来的不稳定性,描述机械电子系统的输入与输出关系就变得困难重重,传统上的描述方法有以下几种:1)推导数学方程的方法;2)建设规则库的方法;3)学习并生成知识的方法。传统的解析数学的方法严密、精确,但是只能适用于相对简单的系统,如线性定常系统,对于那些复杂的系统由于无法给出数学解析式,就只能通过操作来完成。现代社会所需求的系统日益复杂,经常会同时处理几种不同类型的信息,如传感器所传递的数字信息和专家的语言信息。由于人工智能处理信息时的不确定性、复杂性,以知识为基础的人工智能信息处理方式成为解析数学方式的替代手段。
通过人工智能建立的系统一般使用两类方法:神经网络系统和模糊推理系统。神经网络系统可以模拟人脑的结构,分析数字信号并给出参考数值;而模糊推理系统是通过模拟人脑的功能来分析语言信号。两者在处理输入输出的关系上有相同之处也有不同之处,相同之处是:两者都通过网络结构的形式以任意精度逼近一个连续函数;不同之处是:神经网络系统物理意义不明确,而模糊推理系统有明确的物理意义;神经网络系统运用点到点的映射方式,而模糊推理系统运用域到域的映射方式;神经网络系统以分布式的方式储存信息,而模糊推理系统则以规则的方式储存信息;神经网络系统输入时由于每个神经元之间都有固定联系,计算量大,而模糊推理系统由于连接不固定,计算量较小;神经网络系统输入输出时精度较高,呈光滑曲面,而模糊推理系统精度较低,呈台阶状。
随着社会的不断发展,单纯的一种人工智能方法已经不能满足日益增长的社会需要,许多科学家开始研究综合性的人工智能系统。综合性的人工智能系统采用神经网络系统与模糊推理系统相结合的方法,取长补短,以获得更全面的描述方式,模糊神经网络系统便是一成功范例。模糊神经网络系统做到了两者功能的最大融合,使信息在网络各层当中找到一个最适合的完全表达空间。逻辑推理规则能够对增强节点函数,为神经网络系统提供函数连结,使两者的功能达到最大化。
4结论
徐立有着典型的人工智能科学家背景,在香港中文大学就读博士期间,其与导师贾佳亚教授研发的图像去模糊技术将图像清晰度提升了100倍,被视为是全球图像处理的一大突破。以研发实力闻名的商汤也一度被“学术气息”所标签化。徐立认为,人工智能还远未走向技术同质化的时代,若技术上不构成领先性和差异化,将难以跟上行业变化。对于人工智能的商业落地,商汤则自有一套驱动行业的经营哲学。
21CBR:智能视频目前是“人工智能+安防”的行业热点,你在去年也提过类似观点,这块的市场存量有多大?
徐立:安防一直是国家大力发展的领域,也是十三五规划的重点行业。从政府投入来看,今年也要投入2000-3000亿。传统安防领域的最大厂商,去年营业额在300多亿。所以,这块目前有足够的市场空间。
今年的视频业务和去年的人脸识别有些类似。去年,业内都在尝试和落地人脸识别的具体应用,到今年进入相对成熟期,业务增长很快。今年,智能视频业务也在各地展开试点,整体发展正处在一个大的行业机会点上。
视频业务何时落地,核心问题在于明确产品的商用标准。工业界的一个标准红线是评估产品是否超过所谓人眼的准确率,这也是人脸识别逐渐商用化的原因。但是视频内容的分析和人相比效果上还有差距。目前全球每天有2.5亿只安防摄像头在记录,视频数据输入达到一定规模,但在智能处理上还很欠缺,而核心算法的突破将成为最关键的落地因素之一。
21CBR:商汤切入安防领域有哪些布局,如何构建自己的智能视频生态链?
徐立:商汤在安防领域的产品体系分为两类:一类是成熟的业务系统,需要基于客户方的具体业务逻辑进行设计,比如怎样做多视频协调,如何做人像处理等,代表产品是SenseFace人脸布控系统和SenseVideo视频结构化系统,另一类是业务系统中的核心算法模块,包括动静态比对服务器、人群分析服务器和结构化服务器等,儆谙喽员曜蓟的产品。
举例来说,我们在视频结构化系统上做了很大突破。以往的视频结构化系统只能通过身高、性别等属性来查询视频信息,SenseVideo实现了自然语言的信息查询。我们做了1.3万人的案例测试,总共生成了9000多个自然语言构成的关键词。对于办案人员来说,通过自然语言来描述罪犯、完成案件信息的视频检索是更常见的业务逻辑,也比根据属性搜索来得更加精准,未来将是一个新的业务形态。
目前商汤在安防市场相较领先,前十大安防厂商一半以上是我们客户,商汤为其提供标准化模块和业务子系统。同时,我们也在国内重点城市建立本地化业务。去年,商汤的智能视频业务(Intelligent Video Analytics)已占公司整体业务的40%,今年这一势头依旧良好。
21CBR:比起发展客户,商汤似乎更擅长行业联盟,商汤的市场开拓逻辑怎样的?
徐立:首先,无论卖什么产品,最后都要接触到甲方。但是,我一直认为,B2B企业如果要起量、要规模化,产品一定是相对标准化的。如果每次销售的方案都是定制化服务,企业的ROI(投资回报率)就会比较低。相反,集成商则可以将商汤与电信方、施工方等等连接起来,在各地做出标杆性的项目,再用标准化的形式去铺开。
这里的标准化不是一蹴而就的,而是来自产品和项目的逐次迭代。比如前面提到的比对服务器,再往上可能是一套带着摄像头的子系统,最后则是一整套的训练部署平台。通过深入行业、做细项目,商汤不断把标准化的范围扩大,并聚合客户的需求从而形成共有需求,最终完成标准化产品的打磨过程。
因此,商汤一直把自己定位成一个技术公司,而不是集成商公司。商汤能做的是集中力量攻破核心算法和技术。这个技术不是单点的、闭门造车的技术,而是以打通上下游的客户需求、构建产业链条来实现的。就像英特尔不直接向终端用户销售芯片,而是通过上下游的合作伙伴,比如主板厂商、主机厂商等实现笔记本电脑的销售,但用户仍然了解产品背后有英特尔领先的芯片技术,这也是商汤所追求的:做行业的赋能者。
21CBR:业界普遍在谈AI同行业的深度结合,各家公司从技术表现来看也大致相当。对此你怎么看?
徐立:很多人觉得,深度学习已经形成开源生态,技术没那么重要了,打通行业才是关键。这里面有一个重要前提:深度学习是否已经成熟、不会再变化了。然而,学术界目前有关深度学习的文章大部分都是工程实践型的,新的实验结果不断前人做出的理论解释,指导下一代工业级应用的技术原理有待被归纳总结,人工智能距离成熟的“黑盒”还差得很远。
例如,从近年来物体识别竞赛的结果看,识别准确率在2013-2017年之间提升了300%,基本与摩尔定律吻合。也就是说,在某些垂直领域,算法的演进已经进入摩尔定律时代,不是既有算法的变化,本质上是重新设计出一套新的引擎算法,从而形成巨大的提升空间。未来三五年间,深度学习还将迎来革命性的变化,现有的算法如果不赶上,就会被淘汰。
前一阵子,特斯拉的总裁马斯克、物理学家霍金突然发声,要大家警惕超级人工智能。这件事多少有点奇怪。对人工智能的恐惧感大众并不陌生,已经有一大堆科幻电影靠着这种情绪赚得大笔票房了。可这一次,一个是世界上最知名的企业家(可能没有之一),一个是在世的最知名的科学家,两位都是媒体关注的焦点,他们说要警惕,事情似乎非同小可?
并没有。尽管大家都喜欢《终结者》之类的电影,可真要让我们在平时关注一下看不见摸不着的东西,反而是件难事。而且,霍金不是不久前还说要大家小心地外生物吗?对于这些事情,我们更多抱以微笑:老爷子醒醒吧。我们尽管看不懂你的那些理论,但还是非常尊敬你的,喊狼来了就不好了。
但是还有另外一些事情同时发生:就在最近这几年,人工智能和它的交叉学科如机器学习、计算机视觉、自然语言处理等等,出现了不少惊艳的产品,也诞生了许多家估值甚高的创业公司。
有一些我们已经体验过了:Google的照片应用不仅能根据拍摄信息自动将我们的照片分类,还能分辨出图像中的动物是猫还是狗;无人驾驶汽车已经在美国很多公路上实验性地驰骋;利用深度学习,各家公司正在更精准地投放广告;IBM的沃森登上了美国版“开心辞典”,在智力问答中击败了之前卫冕时间最长的人类冠军;微软的翻译系统已经能做到实时翻译,通话时对方的西班牙语传到你的电脑时已经变成了翻译好的英语。
我们甚至有点习以为常了,甚至觉得有些技术本应如此。但其实,这里举出的各种技术都是最近十年内从不可用、难用变得可用的。科技和投资领域盯上这块下一个爆点已经很久了。
然而说来也怪,这些进展和之前提到的超级人工智能好像不是一回事啊?电影里的超级人工智能,不是应该闪烁着一簇邪恶的红色眼睛,不,发光二极管,用奇怪的金属音说话,除了毁灭人类没有其他事情可做吗?或者,那些温柔的机器人不是既能够理解人类,又学会了爱与幽默感?我们要的是人一样的机器,你们却发明了更精准的广告投放?
翻开《人工智能》的教材我们就会发现,公众对于这个字眼的理解,向来和教科书差距不小。教材中最大篇幅介绍的,往往是让计算机求解一个问题,其次关注的,有让计算机理解自然语言、推理、知识表示等;相关的,也有希望通过计算机制造一个神经系统;还有另外一派,通过统计方法,让计算机完成各种任务。这些充满术语的大部头教材,怎么看都和电影里的人工智能不沾边。然而如果了解一点背景和技术,又会发现很多事情是今天这个样子,实在是顺理成章的。
这要从上世纪五十年代年说起。1956年,一群年轻教授和工程师收到约翰・麦卡锡等人的邀请,齐聚达特茅斯大学,召开一个会议。他们有着共同的学术兴趣,都在关注计算机能否思考这个话题,然而对于什么是思考、什么是智能,却没有统一意见。本来,大家对当时的学术进展也都很了解,并不指望在会上看到什么重大突破(也确实没有),但这次会议把后来这个领域大牛们第一次聚集在了一起。就是在这次会议上,大家决定,把相关的研究单独列出来称之为“人工智能”。会上,西蒙和纽厄尔展示了逻辑理论家,一个能够自动证明数学定理的程序;马文・明斯基带来了神经网络模拟器;麦卡锡本人则演示了自动下象棋的程序。这次大会不久之后,麦卡锡的团队实现了一种人工智能研究常用的计算机语言Lisp。这十年,是人工智能奠基的十年。
我们在这里可以一窥人工智能领域后续的发展方向:一是创造像Lisp这样的工具,有了工具并不能让计算机产生智能,但很多工具影响深远,起作用的远超人工智能领域;二是构建神经网络,我们已经知道人脑由神经细胞构成,如果能够构建一个神经网络,就能实现一定的功能,如果能更进一步,兴许能制造出像人脑一样复杂的机器;三是研究计算机的推理运算、问题解决和知识表达。学者们认为,人脑在处理信息时无非也是利用已经具有的知识、通过运算来解决问题,如果计算机能够做到这些,就可以说计算机具有智能。
整个六七十年代,人工智能的研究主要围绕的是第三点。这种取向有着深厚的背景,在人工智能这个词还不存在的年代,已经有无数学者曾思考思维的本质,他们把思维抽象为运算,而如果能够让机器学会这种运算,我们自然就得到了智能。
不仅因为这种研究的观念和我们对思维的看法最接近,也因此它是最容易上手的。五十年代的时候就已经有了自动证明数学定理的工具,之后又诞生了各种有一定运算能力的程序或者机器。最后还有一点,那就是冷战背景下,政府和军方的巨额投资。当时,他们认为,人工智能可能产生重大的科技突破。想想看,如果有永不疲倦的雷达员检测敌人,如果有不需眼睛和手的翻译官将俄文资料翻译成英文……这真是诱人的前景。当然,研究神经网络的学者也没有止步不前,他们实现了一些更复杂的模型。只不过,他们选择了一条窄门,突破更难取得。
事情很快起了大反转。到七十年代末的时候,已经苦等十余年的投资人开始抱怨,为什么那些神奇的机器还是没有发明出来?为什么所谓的智能只会推理数学,而一些小孩就能做出的判断计算机却怎么也做不出来?不多久,政府大幅缩减了人工智能研究的预算。
人工智能迎来了一次低潮。而另一种方法却正在暗中生长。我们现在称呼这种方法为机器学习,尽管它和我们平时用的“学习”这个字眼并不那么接近。机器学习的方法看起来彻底放弃了让计算机去表达知识之类的想法。既然计算机最强的能力莫过于高速计算,那么索性让它在自己的长项上发挥吧。机器学习的专家不那么在乎计算机表现的是不是智能,他们设计、实验各种精妙的算法,让计算机可以解决特定的任务。到了八十年代,很多领域都迎来了突破。我们有了最初的自动驾驶,能够用计算机给图片做分类,能够让计算机和人类世界冠军下棋。实现这些的办法,和过去我们渴望的人工智能并不完全一致,然而却在效果上大获成功。
几乎同时,研究运算与知识的方法效果不佳,但神经网络的研究却兴盛了起来。一些学者自称联接主义者。他们的思想来自六十年代。可现在有了更好的计算机、更好的实现方法,也对神经有了更多了解。他们索性就不去考虑意识啊、思维啊是什么这些大问题,而是把精力放在构建神经网路的模拟上。很多人不同意他们的思考方式,但是大家对于建造一个模拟的大脑还是很有兴趣的。
最近几年,一个叫做“蓝脑计划”的项目被很多媒体报道。这个计划已经利用超级计算机模拟了一个大脑,复杂度大概相当于猫的大脑。我们仅通过这个计划,大概也能判断这种方法前景巨大――想想看,如果能模拟一个人类大脑的话会怎么样?当然,你也能猜到这有多难。历经数年时间、投入大量金钱之后,目前我们只得到了一个猫脑。
最终胜利的似乎是机器学习的方法,这种我们对智能理解差异最大的方法。如今,流行的机器翻译、语音识别、自动驾驶、图像识别、打击网络犯罪乃至反恐……机器学习已经全面开花,与其相关的词还成了行业甚至全民热词,比如数据挖掘、数据科学家、大数据等。一些持传统观点的人工智能研究者实在没法同意,计算机表现的这些能力是一种智能。然而机器学习解决问题的效果实在是好。
那么,这就是超级人工智能的雏形了?自八十年代以来,计算机的能力提升了那么多,很多实验性的研究已经成了我们每天使用的工具。然而如今,我们还是造不出能两腿行走的机器人,计算机很难分辨扭曲的字母或面孔,对于人类的常识也很难理解,能够做出判断的专家系统一般只局限于少数专业领域。总之,许多一个人类小孩就能胜任的工作,依然是计算机所不擅长的。计算机的能力如此强大,但似乎又和我们想象的智能不是一回事。于是问题来了,超级人工智能的威胁在哪里?
答案也许要分两部分。第一部分是我们的心理因素。毕竟,人类是我们已知的唯一智能生物,我们对智能的所有了解其实都来自我们自身。我们对地外生命和人工智能总有着强烈的好奇与恐惧,是因为我们从来不知道和我们不尽相同的智能生命是什么样的,它们又会有什么样的情绪和态度。
在人工智能作为一个学科诞生之前,数学家图灵就坚信机器可以有智能。他设计了一个判断机器是否有智能的图灵测试:一个人向屋子里的机器提问,如果后者回答一系列问题后人类仍然无法判断它是人还是机器,那么这个机器就具有了智能。这是一个简单粗暴又无比高明的方法,避开了什么是智能的种种争论。然而,这种测试得到的不仅是一台有智能的机器,还是像人一样的机器。我们对这种机器如此的好奇又恐惧,这种情绪,将伴随未来所有研究。
前不久,一场围棋大战吸引了全世界的目光。这场大战在韩国首尔上演,共5轮。大战之所以举世瞩目,是因为对战的双方是韩国九段棋手李世石与围棋人工智能程序AlphaGo。令人惊叹的是,整个比赛过程中,AlphaGo的表现都堪称完美,最终以4:1击败李世石。
这个战胜人类世界围棋冠军的AlphaGo程序到底是何方神圣?它为什么如此厉害?人工智能对人类来说到底意味着什么? 从“深蓝”到AlphaGo
人工智能是计算机科学的一个分支,它企图了解人类智能的实质,并生产出一种新的、能以与人类智能相似的方式做出反应的智能机器。人工智能是对人的意识、思维的信息过程的模拟,使得机器能像人那样思考,甚至超过人的智能。自1956年这个概念被提出并确立以来,该领域就被视为人类最高的梦想之一。
1997年,IBM的超级计算机“深蓝”以2胜1负3平的成绩战胜了当时世界排名第一的国际象棋大师加里・卡斯帕罗夫,一时间全球轰动,而“深蓝”的设计者们当时就畅想:何时计算机也能下围棋呢?
而现在无疑又是一个人工智能历史上最重要的时刻。围棋和国际象棋在复杂程度上不属于一个量级,围棋是一种变数极多、充满不确定的竞技,每一步棋的可能性都是一个几乎无法穷尽的量级,一回合有250种可能,而一盘棋可以多达150回合。
此外,下围棋的过程中还会出现“吃子”情况,加剧了其复杂性。曾任职谷歌公司的李开复说,当年“深蓝”与卡斯帕罗夫的对局,实际上使用的是人工调整的评估函数,并用特殊设计的硬件和“暴力”的搜索征服了国际象棋级别的复杂度,围棋则不行。“因为它的搜索太广,每一步的选择有几百而非几十;也太深,一盘棋有几百步而非几十步。”李开复在知乎上如此回答。
此外,围棋问题与现实生活中的问题相通,国人甚至将下围棋视为洞悉人性、参悟人生的过程。然而,现在下围棋的却是一个机器,意味着这个机器除了拥有超强的记忆能力、逻辑思维能力,还要拥有创造力甚至个性。
“感觉就像一个有血有肉的人在下棋一样,该弃的地方会弃,该退出的地方退出,非常均衡的一个棋风,真是看不出出自程序之手。”围棋排名世界第一的柯洁说,AlphaGo有好几次落子极其“非常规”,许多专业棋手都表示看不懂。而“棋圣”聂卫平甚至表示自己想要对AlphaGo的“惊人一手”脱帽致敬,因为它“用不可思议的下法辟立了围棋常识之外的新天地”。也就是说,这不是AlphaGo从既往棋局中复制过来的,而是自己创造的战术打法。 人工智能进入实用阶段
实际上,AlphaGo是通过蒙特卡洛树搜索算法和两个深度神经网络合作来完成下棋。在与李世石对阵之前,谷歌首先用人类对弈的近3000万种走法来训练AlphaGo的神经网络,让它学会预测人类专业棋手怎么落子。然后更进一步,让AlphaGo自己跟自己下棋,从而又产生规模庞大的全新棋谱。谷歌工程师曾宣称AlphaGo每天可以尝试百万量级的走法。
“它们的任务在于合作‘挑选’出那些比较有前途的棋步,抛弃明显的差棋,从而将计算量控制在计算机可以完成的范围内。在本质上,这和人类棋手所做的一样。”中科院自动化研究所博士研究生刘加奇说。
“传统的棋类软件一般采用暴力搜索,包括深蓝计算机,它是对所有可能结果建立搜索树,根据需要进行遍历搜索。这种方法在国际象棋、跳棋等方面还具有一定可实现性,但对于围棋就无法实现。”中科院自动化研究所研究员易建强说,“ AlphaGo利用深度学习的方法降低了搜索树的复杂性,搜索空间得到有效降低。比如,策略网络负责指挥计算机搜索出更像人类高手该落子的位置,而估值网络负责指挥计算机搜索出后续更有可能获胜的一个落子位置。”
刘加奇进一步解释,深度神经网络最基础的一个单元就类似人类大脑的神经元,很多层连接起来就好比是人类大脑的神经网络。AlphaGo的两个神经网络“大脑”分别是策略网络和估值网络。
“策略网络主要用来生成落子策略。在下棋的过程中,它不是考虑自己应该怎么下,而是想人类的高手会怎么下。也就是说,它会根据输入棋盘当前的一个状态,预测人类下一步棋会下在哪里,提出最符合人类思维的几种可行的下法。”
然而,策略网络并不知道自己要下出的这步棋到底下得好还是不好,它只知道这步棋是否跟人类下的一样,这时就需要估值网络来发挥作用。
刘加奇说:“估值网络会为各个可行的下法评估整个盘面的情况,然后给出一个胜率。这些值会反馈到蒙特卡洛树搜索算法中,通过反复如上过程推演出胜率最高的走法。蒙特卡洛树搜索算法决定了策略网络仅会在胜率较高的地方继续推演,这样就可以抛弃某些路线,不用一条道算到黑。”
AlphaGo利用这两个工具来分析局面,判断每种下子策略的优劣,就像人类棋手会判断当前局面以及推断未来的局面一样。在利用蒙特卡洛树搜索算法分析了比如未来20步的情况下,就能判断在哪里下子赢的概率会高。 “奇点”正在临近?
人工智能越来越近。显然,它并不会只用来下棋,实际上它正掀起一轮轮产业变革、经济变革甚至社会变革。
“人工智能将有助于人类解决疾病、医疗、气候、能源、数据、游戏等多个领域的问题,我们将与各领域最顶级的研究人员合作,促进人工智能与创业、产业领域的有机结合。” AlphaGo开发者德米什・哈萨比斯表示。
哈萨比斯当然不想把人工智能局限于棋盘上,他将目光投向了更为广阔的世界,力争开发出可以用于多个领域的通用型学习机器,制造出可以像人类一样从白纸状态通过自主学习找到问题解决方案的人工智能。他将这一目标比喻为实现人类登月梦想的“阿波罗计划”。哈萨比斯还说,未来将开发在任何地方都能使用的通用人工智能。也就是说,从硬件到软件、从个别商品到系统的统合,这种趋势将会改变产业和人们的日常生活。
同哈萨比斯一样,全球顶级企业也将“赌注”压在了人工智能之上。全球科技商业预言家、畅销书《失控》作者凯文・凯利认为,未来20年,全球最重要的技术就是人工智能。英国帝国理工学院的人工智能学者马克・戴森罗克说:“如果人工智能以这种速度发展下去,我们或许在未来10年到20年里就能看到电影《钢铁侠》中那个人工智能助手贾维斯。”
韩国《中央日报》的报道称,人工智能的威力正在进入实用阶段,因为像谷歌、IBM、微软、苹果、Facebook这种世界级的信息通信技术企业,把与大数据相结合的人工智能技术陆续在医疗、金融、体育、社交网络领域实现实用化。人工智能技术与制造业的接轨也在变快。有人预测,如果人工智能与无人驾驶汽车接轨,那么将没有交通事故,保险公司也将无需存在。如果让人工智能与无人机接轨,毫无疑问这将使得商业化如虎添翼,也将给武器系统带来影响。
此外,2015年,专注于初创企业的市场调查公司“风险扫描”追踪分析了全球855家人工智能初创企业,发现这些企业横跨13个门类,总估值超过87亿美元,其中计算机深度学习和视觉图像识别两个方向最受投资者青睐。
在科幻电影《超验骇客》中,约翰尼・德普饰演的科学家因为研发人工智能而被恐怖组织暗杀,临死之前仓促地将自我意识上传至电脑。最后,这名科学家成为一个能够不断进化的结合生物智慧和人工智能的“超级计算机”。
AlphaGo战胜李世石之后,人工智能通过自我进化增加智慧已变为现实。搜狗CEO王小川认为,人工智能能做到随着时间推移变得越来越聪明,正如金庸小说中老顽童让自己的左手和右手“互搏”,从而练就绝世武功。
“在下棋这个领域,AlphaGo这样一台在算法上没有天花板的机器,将有机会登峰造极。”王小川评价说。
并非所有人都对人工智能抱以乐观的态度。早在1993年,美国科幻作家弗诺・文奇在《即将到来的技术奇点》一文中写道:“在未来30年间,我们将有技术手段来创造超人的智慧。不久后,人类的时代将结束。”在他的描述中,所谓“技术奇点”是指在未来的某个时期,当机器达到“强人工智能”时,智商将超过人类,从而对人类社会造成巨大冲击。
而自称美国未来学家的库兹韦尔则在他2005年出版的《奇点临近》一书中,把“技术奇点”进一步转述为“奇点理论”。他描述道:“2045年将出现‘奇点’时刻,人类文明走到终点,生物人将不复存在,取而代之的是一个叫做‘奇点人’的新物种。”
霍金也对人工智能表示极度担忧:“人工智能开发成功将会是人类历史上最大的事件。但不幸的是,这可能也会是最后一个大事件。”去年,霍金还与特斯拉创始人伊隆・马斯克、苹果计算机共同创办人史蒂夫・沃兹尼克等数百名顶尖精英发表联署公开信,表示人工智能对人类生存的威胁更甚于核武器。
霍金认为,特别是高科技军事装备的普及,如美军在战场上大量使用无人机远程杀敌,或多或少印证了这种忧虑。
XML技术以及其他相关技术的快速发展改变了Web应用发展的格局: 它将Web应用从信息交互的领域扩展到了服务交互的领域,这种服务交互就是当前引起工业界和学术界关注的Web服务(Web Services)。
但随着Web服务的大量涌现,如何使机器自动、准确、高效地进行服务发现、服务匹配、服务组合、服务监控和服务调用,成为Web服务研究中的热点和难点问题。而语义Web为这些问题的解决提供了新的途径。
语义Web研究的主要目的就是扩展当前的万维网,使得网络中的信息具有语义,能够被计算机理解,便于人和计算机之间的交互与合作,其研究重点就是如何把信息表示为计算机能够理解和处理的形式,即带有语义。语义Web具有一套完整的架构来实现Web资源的语义标注和推理。语义Web服务是将语义Web技术和Web服务技术相结合,如附图所示。
利用语义Web丰富的语义描述能力和强大的逻辑推理能力来准确地描述Web服务的语义,通过这些带有语义信息的描述来实现服务的自动发现、组合、监控和调用。
服务的语义描述
服务的语义描述问题是语义Web服务需要解决的首要问题,它是实现服务发现、匹配、组合、监控和调用等功能的前提。2002年BBN Technology等几家研究机构和大学联合推出的DAML-S WS本体描述语言是语义Web服务成为Web服务和语义Web研究领域中新的独立的研究方向的标志。DAML-S从三个相关的方面描述Web服务本体,它们分别是: 语义概况、语义进程和WSDL映射。
OWL-S是2003年W3C建议的Web服务本体描述语言,它由DAML-S发展而来,与DAML-S没有本质区别。WSDL-S是W3C2005年底根据IBM和Georgia大学提交的草案修改的一种语义Web描述方法。WSDL-S采用在服务的WSDL文件中添加语义描述的办法,尽量保持与现有协议与技术的兼容性。
ESSI是欧洲研究语义Web服务的组织,该组织推出了WSMO(Web Service Modeling Ontology)、WSML(Web Service Modeling Language)和WSMX(Web Service Modeling eXecution environment)三个语义Web服务标准。
语义Web服务匹配
语义Web服务匹配是语义Web服务中的另一个基本问题,它的作用是从已经的服务中发现与用户需求最匹配的服务,同时也是服务需求方与服务提供方进行服务语义匹配的过程。
语义Web服务匹配主要有基于逻辑推理的和基于词汇相似度计算的匹配算法。其中基于词汇相似度的匹配方法主要用借助IR(Information Retrieval)技术中的词汇相似度的计算来判断不同的语义Web服务中各项功能及性能描述的匹配程度。因为语义Web的逻辑基础是描述逻辑(DL),逻辑推理的匹配方法主要通过DL推理机来判断不同的语义Web服务的功能描述的一致性。由于Web服务可以看做是一种动态的知识,每一个服务可以看成一个动作,它的执行会改变Web的状态空间和数据空间。
OWL-S中的Input/Output 就是描述Web 服务执行前后数据空间的改变,而Precondition/Effect就是描述Web服务执行前后状态空间的改变。由于普通的描述逻辑缺乏描述动作和状态空间改变的能力,所以中科院计算所的史忠植研究员等在DL中引入动作的表示和推理,发展成动态描述逻辑,用于进行服务匹配和组合过程中的推理。
语义Web服务组合
语义Web服务组合是语义Web服务的重要目标和研究热点之一,它使得独立的Web服务能够自动组合起来满足单独服务所不能满足的用户需求,同时它也是语义Web、Web服务、智能规划等研究领域的交叉领域。
由于研究服务组合问题的目标不同,工业界和学术界对于Web服务组合的概念存在不同的理解。工业界主要从应用角度来研究如何借助服务组合技术来整合服务资源,一般采用静态组合、动态绑定的方式,组合的自动化和动态适应性程度不高。学术界主要从服务理论建模的角度研究实现服务组合自动化的问题,其主要思想是在语义Web的研究成果之上,利用本体语言的丰富语义以及推理能力,实现Web服务组合的自动化。
Web服务组合的很多技术是从已有的方法中继承和发展出来的,可以按照Web服务组合方法分成三类。一类基于工作流,它对Web服务组合产生了很大的影响,典型的基于工作流的方法有BPEL4WS、eFlow等。另一类基于软件工程的方法,Web服务可以看成是一个独立的软件模块,软件工程中的一些原则、技术、思想同样可以应用于Web服务组合。典型的软件工程的方法如Web Component或者程序自动生成的方法。还有一类基于人工智能,由于传统的Web服务描述语言WSDL缺乏语义上的描述,所以学术界普遍采用OWL-S、WSDL-S、WSMO等语义Web的方式来增加Web服务的语义描述,然后使用人工智能来自动或者半自动地生成Web服务组合。
未来展望
随着互联网的快速发展,基于互联网和Web服务的各种应用和商业模式层出不穷,工业界和商业界和各国政府都将互联网经济作为一个巨大的机遇和挑战,并对此进行大量投资。作为互联网技术支柱之一的Web服务也遇到了空前的机遇和挑战,而因为Web服务的巨大应用前景,它也同样成为了学术界的研究热点。
Web服务的理想状况是服务的发现、选取、组合、调用及监控过程的机器全自动化实现。语义Web服务是Web服务的应用与研究发展的重要反面。结合先进的人工智能技术,使互联网越来越智能化,更好地为人类服务,是互联网发展的目标和趋势。
语义Web服务就是为解决智能化Web服务而将人工智能中的语义技术和Web服务结合的尝试。由于语义研究的逻辑基础(描述逻辑、动态描述逻辑等)在过去20多年的稳固发展,它给语义Web服务提供了一个良好的基础和保证。但是现在的语义Web服务也存在着语义描述、语义理解困难,语义推理效率较低的问题,语义Web服务要得到广泛应用,要与其他各种计算机技术,如网络技术、软件工程技术、人工智能等相结合,才能达到Web服务的理想境界。
链接
国内在语义Web服务上的进展
Stair是一台样子古怪的设备,像一个架在轮椅上的花架,但是实际上它是一部人工智能机器人。
坐在会议室桌旁边的工作人员对Stair说: “Stair,请从实验室拿来订书机。”站在旁边的Stair回复道: “我会为您去拿订书机。”如果仔细分辨,Stair说话时,还带着一种鼻音。
Stair迅速启动――它靠两个轮子行进,在实验室内自由穿行,一路上自如地避开各种障碍物。它的“眼睛”是一部立体照相机,这对“大眼睛”不断灵活地来回转动,拍下房间里面的内容,以确定行进的路径以及判断哪些是障碍物。
Stair穿过零乱的实验室后,来到一张桌子前,似乎考虑了一下后,仔细打量了桌子上的长方形金属物体――订书机。然后它伸出关节臂,转来转去,用外面裹以橡胶的长长手指缓缓地夹起了订书机,然后原路返回会议室。Stair将订书机交给工作人员说: “给您订书机。祝您今天过得愉快。”
以上的场景并不是出现在科幻电影或书籍中,而是在现实生活中活生生地存在着。
如今,人工智能领域研究人员的心情越来越好,他们所研究的成果在不断地取得突破。尽管Stair的表现与替主人捡报纸的小狗相比似乎强不了多少,但这在几年前还是不敢想象的。
Stair代表了新一代的人工智能,集成了学习、视觉、导航、操纵、规划、推理、语音和自然语言处理等多项技术。它还标志着人工智能从细分的狭小领域,进入到系统能够学会处理复杂数据、适应不确定情况的现实世界。
咸鱼翻身
人工智能在自身发展中,经历了不少磨砺。技术先在幕后隐藏了几年,经过一轮轮炒作后,突然闪亮登场。随后要是技术没有兑现不切实际的承诺,就名誉扫地。取得了显著成就后,终于被人们所接受。
人工智能起源于上世纪50年代末期,后来在80年代凭借“专家系统”而备受瞩目。专家系统先与真实世界的专家(比如国际象棋冠军)“过招”,然后通过软件把专家的一套逻辑规则编入到系统中。如果情况A发生,就做X,如果情况B发生,就做Y。微软研究部门的人工智能研究人员Eric Horvitz表示: “尽管专家系统在处理下棋等特殊的任务时表现不俗,但它们实际上‘功能很弱’。”
Horvitz认为,专家系统的作用主要是获取大量的人类知识,然后设法把这些知识组合成具有人类推理本领的推理系统。但是它们无法“扩展”,也就是说无法适应编程人员之前没有明确预料到的情况。
如今,人工智能系统已经发展到可以在“非常庞大而复杂的世界”执行有用的工作。Horvitz说: “因为这些小小的软件无法完整地表现这个世界,它们对自己该执行什么样的动作并不确定。于是,它们学习了解各种事情出现的概率,它们学习用户偏好,它们变得有了自我意识。”
这些功能来自于所谓的机器学习,这项技术是许多现代人工智能应用的核心。实质上,编程人员最初为自己要解决的某个问题建立一个简陋模型,然后添加让软件能够通过经验不断适应、完善的功能。以语音识别软件为例,这一类软件日臻完善,已经能学会察觉人的声音的细微变化。比方客户在网上购物时,通过声音输入,一些网站就能够更准确地预测客户的购物偏好。
数据是关键
机器学习当然离不开灵巧的算法,但是近些年来促使机器学习备受瞩目的背后原因是,现实生活中存在大量数据可供分析使用,这些数据来自互联网以及数量激增的物理传感器。Carlos Guestrin是卡内基•梅隆大学的计算机学和机器学习助理教授,他专注于传感器、机器学习和优化等技术。
Guestrin说: “南加州大学和加州大学洛杉矶分校的科学家们把传感器装在机器人船上,以便检测及分析大片水域的破坏性赤潮。人工智能通过算法学会预测水藻的地点和成长情况。相似的是,卡内基•梅隆大学的研究人员把传感器装在地方供水系统中,以便检测及预测污染物的扩散。在这两种情况下,机器学习都逐渐提高了预测的准确性,而优化算法知道把成本高昂的传感器放在哪个地方最适合。”
Guestrin还在开发另外一种系统,它可以搜索数量众多的博客,根据某个用户的浏览记录和偏好,找出该用户有兴趣阅读的博客。他表示,这项任务听上去与通过传感器预测污染物扩散的任务完全不同,其实背后是一样的原理。
“污染物通过供水系统来扩散,基本上就像新闻故事通过互联网来传播。我们能够使用同一种建模思想和算法来解决这两个问题。”
Guestrin还认为,像博客过滤器这些具有人工智能功能的工具,其重要意义不仅仅局限于能够每天节省几分钟时间。“我们根据非常有限的信息做出生活当中的决定,比如我们选举谁、我们觉得哪些问题重要。但是人们往往没有做出某种明智决定所需要的那种分析能力,尤其是信息量增加后,我们做出明智决定的能力实际上反而减弱了,而机器学习和人工智能恰恰可以助我们一臂之力。”
微软研究部门在道路交通预测模型中结合了传感器、机器学习以及对人类行为的分析。对传感器和计算机预测而言,预测交通瓶颈似乎是一种不是很困难的应用。以美国某些围绕大城市的州际公路为例,往往在星期一下午5点出现交通堵塞。司机这时可能想知道,什么地方、什么时候出现了交通堵塞的情况,或其他意外情况。另外更重要的是,司机希望堵车之前就知道这种情况会在什么地方出现。于是,微软研究部门建立了一个“意外情况预测”模型,通过以往的交通情况,结合传感器捕获的实际交通流量,学会预测30分钟后的意外情况。在测试时,该模型能够预测西雅图地区道路上大约50%的意外情况。现在该模型已经投入使用、服务于几千名司机,他们可在Windows Mobile设备上收到预警信息。
很少有几家组织需要像搜索引擎公司那样需要弄清楚大量数据的意思。比方说,要是某个用户使用谷歌搜索引擎搜索“玩具车”,然后点击出现在搜索结果顶部的沃尔玛广告,这能为沃尔玛创造多少价值呢?谷歌应当为这次点击收取多少费用呢?答案就在于人工智能采用的“数字交易”(digital trading agents)这项特长,沃尔玛和谷歌等公司在网上自动拍卖中运用了这项技术。
密歇根大学教授兼搜索市场专家Michael Wellman解释: “关键字多达数百万,一个广告客户可能只对其中的数百个或数千个有兴趣。他们必须关注关键字的价格,然后决定如何分配广告预算。谷歌或雅虎要弄清楚某个关键字的价值多少太难了,他们就让市场通过拍卖过程自行决定价值。”
“玩具车”查询提交上去后,谷歌会在极短的时间内查询哪些广告客户对这些关键字感兴趣,然后查看他们的竞价,决定显示谁的广告、把广告投放在页面上哪个部分。Wellman说: “我特别感兴趣的问题是,广告客户应当如何确定竞购哪些关键字、出多少竞价、如何根据广告实际效果不断学习调整,以及有多少竞争对手在竞购某个关键字。”
Wellman表示,目前已知最出色的模型采用了面对不确定情况来预测价格的机制。显然,任何一方都别指望通过每笔交易来优化财务效益,但是他们可以将机器学习运用到实时报价和竞标上,从而不断提高效益。
研究大脑机理
有人可能以为人工智能是从研究人类大脑工作机理入手的。但人工智能方面的进步大多来自计算机科学,而不是来自生物或认知科学。
这些领域有时有着共通的思想,但它们之间的合作充其量也只是一种“松散耦合”的关系,卡内基•梅隆大学机器学习系主任Tom Mitchell说。“过去人工智能方面的大部分进步来自良好的工程学思想,而不是因为我们观察了大脑的工作机理,然后进行模仿。”
但是,现在这种情况在发生变化。“突然,我们有办法来观察大脑到底在做什么,借助诸如功能性磁共振成像的脑部成像方法。这种方法可以观察人在思考时大脑的实际活动。”Michael说。
他表示,认知科学和计算机科学如今能够实现以前不可能实现的思想共通。比方说,如果机器人做对了事,某些人工智能算法会向机器人发出小小的奖励信号; 要是做错了事,就会发出惩罚信号。随着时间的推移,这会形成累积效应,机器人就会学习、完善。
Mitchell表示,研究人员通过功能性磁共振成像方法发现,大脑的一些部位其实际活动与这种“强化学习”算法预测的如出一辙。他说: “人工智能实际上有助于我们开发了解我们大脑中实际活动的模型。”
Mitchell及其同事一直在研究脑部成像方法所揭示的大脑神经活动,以解读大脑在如何呈现知识。为了训练自己的计算机模型,他们为实验对象出示了60个名词,比如电话、房子、番茄和胳膊, 然后观察大脑在看到每个名词后出现的图像。随后,他们使用谷歌收录了一万亿个单词的文本数据库,确定了往往伴随60个基本单词出现的几个动词,比如伴随电话的铃响,然后根据两者都出现的频率,为这些单词赋予权重。
随之形成的模型就能准确预测之前从未见过相应图像的某个单词会引起大脑出现什么样的图像。简单地说,这种模型就会预测,名词“飞机”带来的大脑图像更像是名词“火车”带来的大脑图像,而不像名词“番茄”带来的大脑图像。
Mitchell说: “我们过去感兴趣的是大脑如何呈现想法,而这个试验有望揭示对人工智能来说很棘手的一个问题。怎样才能准确、普遍地呈现知识?也许还有其他经验可以汲取,大脑也很容易忘记知识。”
斯坦福大学计算机学助理教授Andrew Ng领导了多才多艺的Stair的研发工作。他表示,这个机器人证明了人工智能识方面许多之前彼此独立的领域现在足够成熟,可以融为一体,“实现人工智能的远大梦想”。
那么这个梦想到底是什么呢?Ng说: “早先的著名预言称,在比较短的时间内,计算机的智能化程度会与人类一样高。我们依旧希望,在将来的某个时间,计算机的智能化程度会与我们一样高。但这个问题不是十年后有望解决的,可能一百年过后才有望解决。”
链 接
人工智能
在华尔街的应用
近期笔者参加了一个AI创业者沙龙,机器时代CEO杨威分享了智能硬件和新零售结合的分享,对这个正在进入新型终端领域的企业或创业者思考商业化很有借鉴作用。
机器时代成立于2016年,主要业务面向中国人工智能科技公司提供渠道服务、数据服务、供应链服务与投资服务。目前,这家成立不足两年的公司已经在全国14个机场拥有智能硬件零售体验店——AI机器时代。
援引机器时代CEO杨威的说法,机器时代的核心价值观是利他主义。众所周知,超过95%的创业者在经历了漫长的立项,融资,运转,再融资的过程后都会死在市场的检验下,成功上市者寥寥,这个过程相当苦逼。
“机器时代”智能硬件零售体验店的建立是“加快创业者死亡”的检验平台,是一个逆向思维的孵化器。他以智能硬件产品的检测标准及大数据分析为依托,以真刀真枪的市场机制判定产品的成熟度和未来上市的演变路径,与其说是孵化不如说是洗礼出了一个个成功的案例。
下面,我们利用4P理论来探讨下这个有趣的商业逻辑,希望对寻求AI领域商业化和渠道转型的局内人有些启发。
机器时代商业逻辑
Product 产品
近两年,随着移动互联网的成熟以及云大物技术的发展,智能硬件进入了商业化发展的初期阶段。
来源:GFK新型智能硬件市场解析报告
“机器时代”在人工智能硬件这样一个细分领域,很早的切入市场,秉承“能被用户接受的人工智能产品才算是智能硬件”这一理念。切实抓住了一切新兴市场的痛点,抓住了商机。
如果把“机器时代”零售体验店作为一个产品看,他的产品不仅解决创业者在初创阶段的痛点,同时也满足了用户的需求:
1、创业项目的孵化平台:
(1)智能硬件初创公司变现路径漫长,甚至大量的资本投入打水漂。机器时代为缩短这种纠结命运,加快好的创业项目的进化速度,使用市场的力量宣判不完善的项目尽快迭代或叫停。
(2)创业者对市场的预判不准确,虽然项目有核心技术,但是无市场化基因,无法形成好的产品形成用户侧的BOOM。根据产品的市场反馈,完善产品的迭代升级,打通市场销路,让好的产品能够尽快得到市场认可是孵化成功最有力的基石。
2、智能产品消费的体验平台:
解决消费者没有途径体验线上新潮智能硬件的痛点。
京东等线上平台做了很多年新潮智能产品的众筹,微商社群营销也是新潮产品的一个大流量入口,但是他们都解决不了消费者需要体验,玩转智能硬件的本质,正所谓:“不上手,再好的AI也出不来”,机器时代正是解决消费者的这一刚需。
3、产品众筹平台:
直接将具有市场潜力的产品,经过一套严选机制,纳入囊中,与创业者共同组织首发活动,而独家发售类产品的稀缺性也进一步增加了这一平台的价值。
Price 价格
1、降“上柜门槛”:
创业者可以免费(或以少许费用)在一定时间内在其门店陈列演示产品,最简单粗暴的接触消费者;当然一旦形成合作,就会有相应的商业合作条款。(据笔者了解,目前机器时代有1198家合作厂商,3000余个SKU。)
2、降“购买门槛”:
消费者以体验价格购买独家发售的新奇特产品,既有足够的吸引力也具备一定的传播效应。
Place 渠道
1、“机器时代”体验店进驻在国内14家机场,巨大的人群覆盖率(年3亿人群覆盖),潜在消费者吞吐量绝对是一个独特的选址优势;同时,机场作为一个高端人群的流量高地,也是移动互联网时代“时间战场”下的英雄用武之地。
2、机场场景覆盖了一个庞大的支付能力强的消费群体。
在这个特定场景下,登机前打发时间的消费者非常容易“看见”店面的存在,愿意进店体验(月均进店6万+人次)。
同时,这一人群在愉悦返程前有充分意愿购买礼物或其他地方买不到的新奇特产品,转化率非常高。这就好比,在迪斯尼、环球影城等大的主题游乐场游玩后,消费者特别容易在异常愉快和兴奋的情况下走进纪念品店形成消费。
3、对于合作的上游智能硬件初创公司,这是一个具有独特价值的合作渠道分销平台,入驻门槛以及渠道服务的阶梯性与创业阶段天然吻合,可谓双赢
Promotion 促销
1、利用专业的产品测评标准,用户反馈比对等形成专业意见。据杨威介绍,初创产品的评分如果能大于70分,产品迭代并成功上市将是大概率事件,反之,低于50分,就需要复盘甚至调转方向了。对于创业者来说,这个成绩虽然是“裁判员”给的,但是结果还是要创业者自己去进一步判断和承担。
2、利用大数据,指导创业者自省,all in,迭代,还是止损。“数据显示,一个创业项目的成功,意味着两个项目的死亡”,这是一个相当残酷的市场竞争环境。
3、该平台已经帮助了100多家公司抓去消费体验数据,客诉数据,洞察消费者喜好,帮助产品的迭代改进。最终打造独具竞争力的“爆品孵化模型“,与创业者联合品牌,或建立自有品牌。当然,杨威也透露,另有800家公司并没有实现销量0的突破,AI产品竞争的残酷性可见一斑。
4、虽然 “加快创业者的死亡”的这句口号异常的残酷和黑色幽默,但是一旦形成口碑,创业者趋之若鹜,对于杨威来说实现超级孵化IP的打造。
综上所述,“机器时代”选取AI新型终端这一细分终端市场,通过对这类产品目标客户群体的渠道占据,实现细分产品、细分渠道、细分客户的商业化成功落地。
离开谷歌,回国创业
EW:一开始你是怎么接触到人工智能的?
LZF:2005年,我在美国约翰霍普金斯大学读计算机博士。我所在的实验室是全世界最好的实验室之一,我当时做的就是语音识别、自然语言处理以及机器翻译。
毕业后,IBM、微软、谷歌、雅虎、Facebook的offer我基本上都拿到了。最后选择去谷歌是因为谷歌的机器翻译团队是全球最好的。当时谷歌的产品影响力也更大,再加上我自己对创业文化比较有兴趣,所以想去硅谷看看。
EW:在谷歌工作的经历对你的最大影响是什么?
LZF:主要是两方面。一是基本理念。在学校,我做的是学术,在谷歌,需要把学术的东西产品化、工程化。对我来说,在将技术转化成产品上,自己的能力有了一个非常大的提升。二是谷歌的工作机制和文化。因为我自己一直也想创业,除了做好本职工作,我一直在琢磨,谷歌这样的公司,它为什么能够这么厉害。
比如谷歌的TGIF(Thank God It’s Friday)大,就是每周五下午举行的文化活动,我觉得这就挺有意思的。谷歌到今天,应该还是比较扁平化的公司。它不像其他大公司是金字塔架构,从上往下一层一层,像军队一样把命令严密往下推。
TGIF的作用是,它能够让员工把公司创始人的战略跟自己的工作联系起来。这是至关重要的。因为众所周知,谷歌有一大批极其聪明的人,但聪明的人最麻烦的是,如果他们的目标不一致,大家不是非常清楚地知道为什么要做这件事的话,每个人都会有自己强烈的想法,这样反而可能会以天天吵架收场。通过TGIF活动,创始人可以经常地向员工解释,公司做这个产品的初衷是什么,我们怎么评估对手的竞争,公司接下来的规划是什么等。
EW:出门问问也在参考这种做法吗?
LZF:是的。我们平时也都是每周五下午举行。
EW:创办出门问问4年半,你觉得自己有哪些决策做得特别正确,又有哪些失误?
LZF:很多东西很难说正确还是错误,我只不过是没有什么后悔的。比如,我们当时决定做智能手表,这是一个很大的决定,因为我们的经验不在硬件上。但这是一个我认为很正确的决定,因为有了智能手表操作系统,我们才能去跟谷歌达成合作。另一件事情是我们去年做车载硬件,也是同样的道理,因为做了车载,我们可以去跟大众汽车集团有较大的战略合作。
人工智能这种技术行业,是相对长线的,它不像O2O,时间窗口就那么两个月,过了你就没机会了。技术创业并不是这样的。我觉得我们没有失去这种巨大无比的机会,是因为我们有足够的时间去琢磨产品。可能没有特别大的失误吧,即使有,我们也还不知道。
EW:目前出门问问团队有多少人?你的性格对公司和产品的影响有多大?
LZF:我们现在有接近350人,占大头的还是研发,包括硬件、软件、算法,这部分占了三分之二。
我觉得一家创业公司的文化也好,对内的做事方式也好,一定是跟创始人有特别大的关联的。我觉得自己的性格还是比较偏工程师特质的,比如,我非常推崇效率至上,我最不喜欢干的事情就是花冤枉钱,像O2O这种资金使用效率很低的创业项目,即使做成功了,我也不会有很多喜悦感。
工程师都希望用一个新技术去优化资源,最后让产品有不错的效果。这也就决定了我们公司,如果要去做特别偏运营主导的事情,我们肯定做不好。在那种竞争模式下,如果不烧钱去拼,你可能真就赢不了。
EW:这是否意味着出门问问在市场推广方面存在短板?
LZF:是的,尤其在公司发展早期,在资源和能力都非常有限的时候。我觉得,目前的出门问问,如果跟一家稍微成熟的公司对比,我们的研发费用在总支出中的占比是过高的。因为我们每天都在想着如何创新,如何在市场上做一个有竞争力的产品。但确实,由于我本身不是销售出身,这可能就会导致我们在销售、市场营销的规划和投入上都存在滞后。任何一家创业公司,一定是从自己最擅长的领域出发的,比如你让我带领50名工程师开展工作,我会非常擅长这项管理。应该说,这是一个我们必然会遇到的问题,只是看后面我们如何解决吧。
EW:目前你们研发投入最高的是哪一款产品?
LZF:智能手表Ticwatch和智能车载后视镜Ticmirror的每一款产品,我们都花了不少钱,预算都是数千万元。我们这种模式的性价比可能是比较低的,其实我们完全可以调用免费API,能外包的都外包,而且大家普遍觉得,后者才是目前绝大部分做智能硬件产品企业的模式。但是我们不这样认为,研发这一块,我们全部是独立投入,目前光人工智能算法,我们就有七八十人在做。
EW:回溯这几年,你觉得哪几个节点对于出门问问至关重要?
LZF:主要是两个吧。第一个关键节点就是我们最初开始做硬件,谷歌投钱的,钱还是蛮重要的。第二个是我们真正把Ticwatch第一代做出来并量产,这件事培养了我们公司软硬结合的能力。
围绕语音交互做布局
EW:出门问问4年前曾做过虚拟语音助手,近期你们又了一个虚拟语音助理,在这一产品上,你们经历了一个怎样的迭代过程?
LZF:我觉得我们早期做的语音助手,更像是一个搜索引擎,问一句话,给一个答案,没有上下文对话,也没有远场语音交互。但是,通过这4年的折腾,今天再看语音助手需要的东西,我们发现,我们当时做的是不对的。比如,在车载或家居的场景下,你没有一个基本上下文对话,这种语音交互给用户带来的价值就非常小。
我们现在做的东西,已经不是纯粹的语音交互了,而是一个虚拟的个人助理。它除了能跟你说话交流以外,更重要是他能够懂你,包括你的习惯、常用地址、常去的地方等,能够向你做很多个性化的推荐,甚至有角色帮你去做事。
这是我们4年前完全没想到的。比如,你只要跟虚拟助理说,要订去上海的机票,就不用每次都说我喜欢坐国航的飞机,它是懂你的。这种东西可能慢慢跟语音交互没什么关系了。包括我们讲的跨场景联动,4年半前,我们连一个硬件都没有,有什么能力去思考跨场景联动呢。今天,我这儿有设备,我都可以控制,跟以前完全不同了。
整个大环境也不一样了,现在像媒体、大公司甚至传统行业,都在讨论人工智能。有人讨论,总会有人尝试,这可以认为是一个螺旋式的上升。做的东西或者描述的东西,可能跟之前比较类似,其实是不一样的,我觉得现在是一个新的起点。
EW:出门问问推出的系列产品有着怎样的关系,你们的布局逻辑是怎样的?另外,智能手表、车载后视镜、智能音箱等硬件产品,辐射范围确实挺大,但是对公司来说,会不会有用力太分散的问题?
LZF:肯定有。我同意你说的,会有精力分散的问题。但是我想说,它们其实是有关联的,最重要的是,我们想打造一个跨场景的虚拟个人助理,这背后的核心技术是语音交互。首先,我从来没有做充电器或电风扇,因为这跟语音交互没什么关系。我们希望这个语音虚拟个人助理,无论是在你跑步时、在家里还是在开车时,它都能跟你在一起,无处不在。
这样的话,我们的语音虚拟个人助理,能够让用户熟悉交互习惯,哪些东西能做,哪些东西不能做,这很重要。今天很大的问题是用户对虚拟助理的认知不对,以为它啥都能做,其实不是。但是,你要知道,在手机上能做的事情,在手表上、车里,它也能够做到。我们希望,虚拟个人助理能够对用户的生活轨迹、个人兴趣爱好有更深刻的理解,这样我们才能提供最贴心的服务。
我们希望通过多场景交互,更深刻地去了解语音交互到底应该怎么去做。举个例子,当我们做车里的语音交互时,我们发现,它跟在手机或手表上的语音交互是非常不一样的:在车里,我最希望的是,我不需要用手,不需要用眼睛,也就是所谓的无手无屏交互方式――在车里,你不能问一个问题,再去点一下屏幕,因为你在开车,这样很危险。按照手机的交互模式,你在车里放一首音乐,中间想换一首歌或者换成导航,你得先按一个按钮,把音乐关掉,把地图打开,再用语音说我导航去国贸之类,这会很傻。
家里又是另一个场景,家里对远场语音交互要求更高。手机、手表可能是50厘米内,车载在1米以内范围,但在家里,可能是2~4米的交互范围,我觉得这对技术是个挑战。
EW:亚马逊有Echo音箱,谷歌有Home音箱,百度也在酝酿推出智能音箱,这些巨头似乎都想以家庭智能硬件作为人工智能的切入点。家庭智能硬件这件事,国内已做了好几年,目前看仍是雷声大雨点小,但人工智能公司却非常看好这个市场,你觉得这是为什么?
LZF:因为没别的可做。在这一领域,其实不管是媒体还是创业者,都在关注To C的市场。但我问你,你觉得现在有什么别的石破天惊的新硬件形态出来吗?去年爆红的VR,事实上它也还没有那么快地实现普及。我觉得智能音箱特别重要。
EW:为什么偏偏是音箱,而不是其他家居产品?
LZF:音箱小、便捷。比如电视,现在很多年轻人都不看电视了。第一,我觉得智能音箱是比较好的产品形态,本身需求还是挺大的。第二,电视要成为一个智能家居的中心还是比较难,你要使用电视,必须把屏幕打开才可以用,这样很不智能。但智能音箱是个比较轻量的产品,永远都在那儿,跟智能家居连接起来是比较自然的形态,而且它的额外成本没那么高,价钱相对便宜。
亚马逊Echo音箱在国外卖得比较成功。中国跟美国在智能家居的接受度上还是有差距的。在美国,人们对智能音箱这种概念,认知度可能有60%~70%,而国内可能只有10%~20%的人了解,这本来就存在认知差距。另外是使用场景,美国本来就有听音乐和买音箱的习惯,客厅较大,厨房也是开放式的,这些都是造成中美之间差异的原因。但我认为,使用智能音箱是大的趋势,以后两国都会趋同的。
仍在探寻爆发点
EW:在你看来,目前出门问问发展上的最大烦恼是什么?
LZF:商业化。其实在目前的人工智能公司里面,我们在产品性能、营收上都是最顶级的。我们是2015年6月智能手表Ticwatch及其操作系统的,而真正大规模卖,是同年10月。在早期,我们基本都是做线上,今年才开始建立线下团队。
也有人问过我说,你为什么不先养活自己,先做To B,再去做To C。我的答案是,我们创业从来不是为了活着,只为活着有什么意义。我从来没有生存的危机,我们要活着太容易了。我们真的是希望能够推动一个行业,或者促成一个更大的创新,这才是我们要做的事情。
我希望人工智能技术能够真正用起来,最后产生商业价值。我一直说谷歌,它真是在全世界层面非常成功的一家科技技术型公司,这个没人否认。我觉得谷歌能做到今天,就是因为它把技术用到了可以商业化的地方,然后产生了非常好的商业模式,而这又支撑着它能够不停地进行技术创新。
人工智能走C端市场,本身就是很难的事情。我从来不认为我们成功了,我认为我们是走了一条非常独特的路。如果我们再把销售、市场营销的能力增强一下,说不定我们真的就能够做出一家自负盈亏、能够正向循环的公司。
EW:现在完全没有B端业务?
LZF:我们没有传统意义上的B端业务,但像我们的语音开发平台等是面向B端的。我其实没有那么排斥说一定要做To B或To C,对我来说,我想看到的是,人工智能技术真正能够应用起来,解决一些问题,这是最核心的东西。
我们真的不是为了活着而活着。To B的公司有它的好处,养活自己容易,但要做成规模化非常非常难。今天你要到美元上市,你至少营收得有1.5亿美金,靠To B我觉得真的蛮难的。但你要是卖设备,To C,如果你把产品做好,把渠道打开,其实没有那么难。我觉得To C的天花板很高,To B的天花板比较低一点。
EW:出门问问一开始就获得了真格基金、红杉资本、SIG海纳亚洲的投资,之后是谷歌投资,最近是大众汽车集团独家投了D轮。作为公司创始人,你觉得出门问问为什么能够获得这些知名投资方的垂青?
LZF:我觉得这是要分早期和后期的,不一样。无论是早期的红杉、真格还是SIG,这些机构,说白了是投资我的个人背景以及我的团队,还有我们在技术上做出的一些demo。
其实今天也是一样。我属于较早一批在美国谷歌本部工作,然后要回国创业的科学家之一。这种背景的人,在当时是非常稀缺的,甚至称得上独一无二。
真正懂语音交互、自然语言处理的PH.D,对红杉或真格这些早期投资基金而言,你能够在美国一家最顶尖的学校拿到博士学位,在一家最顶尖的工业实验室做科学家,这本身就是一个很大的背书,而人工智能创业这件事,本身又是技术驱动的,所以对他们来说,当时可能也没有别的更好的选择。所以我说,早期真的基本上是靠我个人、我的团队以及一些基本的技术拿到投资的。
如果说我再重新做一次出门问问的创业,我觉得早期的投资对我来说很简单,只是后面的东西,今天我要再重新做一遍,还真不一定能成功。到后面,我们中间还有别的战略投资者,无论是谷歌还是大众汽车,我觉得我们能拿到这些投资还是有独一无二的价值在里面。
EW:你所谓独一无二的价值,具体是指什么?
LZF:比如2015年,谷歌要把它的智能手表操作系统带进中国,但是它的语音助手Google Now在中国是不能用的。这时候,谷歌要在国内找合作伙伴。出门问问之所以独一无二,是因为我们当时的智能手表已经是一个端到端的产品了。谷歌一看我们的产品,放上去基本上跟在美国是一样的,无论是体验还是配套服务,都已经非常完备了。
当时国内智能手表产品的端到端,就是语音搜索、语义识别、垂直搜索、内容的对接,到最后,整个服务包括圆形屏幕这种手表的展现方式,市场上除了我们之外,真的没别的公司,现在大家可能觉得不可能。如果不找我们,可能谷歌语音用讯飞,语义用另一家公司,搜索内容、UI界面再找另一个团队。那时候我们真的是谷歌唯一的选择。
大众汽车也一样,因为他们不是一个VC的投资,他们希望通过跟我们合作,能够在汽车方面产生一个非常快的协同效应。比如我们的问问魔镜(即Ticmirror),大众汽车觉得,无论从硬件、软件、算法,还是从内容以及语音的交互上看,这都是他们过去想了很多年都没有实现过的东西。这时候,大众汽车如果想在智能化方面快速行动,想建立一个比较扎实的启动点,想在未来提供一个什么样的体验的话,那我不认为在中国除了我们,还有别的公司有这种能力。
EW:D轮这1.8亿美元打算怎么用?
LZF:重点会投入到母公司出门问问以及跟大众汽车合资开设的子公司身上。母公司仍然专注做人工智能,各种算法、迭代,另一块是人工智能的产品化和商业化,我们已经做了可穿戴手表和家居智能音箱,未来可能还有其他商业化产品,我们会去扩充业务方向。子公司就是做汽车的智能化。到目前来说,怎么在汽车不联网,连4G、摄像头都没有,屏幕也很差的情况下,先把汽车的智能化做起来,这是我们正致力解决的问题,也是双方合作的目标。
EW:国内有你比较欣赏的创业公司吗?不一定是人工智能行业的。
LZF:我不能f欣赏,我比较羡慕像今日头条那样的公司。它还是有一些核心技术的,然后用这个技术,快速做出了一家具有海量用户且有很高用户黏性,最后实现了商业变现的公司。它的模式还是比较清晰的。我想,这其实是很多技术创业者梦寐以求但不一定能达到的。