科技巨头们的人工智能竞赛，谁能获胜？

来源：IT时代网作者：闫红玉
2016-02-25

人工智能从其诞生之始便一直备受关注，科技界对人工智能是否会威胁到人类也有很多争论，霍金曾在2014年初指出成功研发人工智能将成为人类历史上犯的最大错误，不幸的是，这也可能是最后一个错误。特斯拉和SpaceX公司掌门人马斯克也曾将研制自治可思考机器的做法描述为“召唤恶魔”，警告称由于机器采用人工智能，“一些极为危险的事情即将发生”，最快将在5年内。

尽管，人们对于人工智能仍抱有一定程度的担忧，但技术的进步并不会因此而停止。近几年来，科技巨头们一直把人工智能作为研发的重心，也陆续有了很多的成果和进展。比如，谷歌的围棋人工智能程序AlphaGo击败人类围棋顶尖高手，而IBM华生超级电脑能从你写的文字中识别出情绪，改变了人工智能冷冰冰的印象，人工智能，不但越来越智能，而且也越来越向人靠近。

谷歌

拉里·佩奇认为，一家科技公司想要保住其主导地位，最好的方式就是投资未来。人工智能显然属于谷歌未来投资非常重要的一部分。

1)收购DeepMind

2014年年初，谷歌以4亿美元的架构收购了深度学习算法公司——DeepMind。7月，谷歌以DeepMind为主体与牛津大学的两支人工智能研究队伍建立了合作关系。DeepMind也很快发布了研究成果，它在2014年10月公布了一种新的模拟神经网络，旨在模仿人类大脑的工作记忆原理，拥有更加强大的归纳整理和联想演绎等逻辑处理能力，从而带来更快的任务处理速度，还可以通过训练去自行处理任务，这种全新的深度学习算法可用于计算机视觉和语音识别等领域。

2016年1月28日，DeepMind团队研发出的围棋人工智能程序AlphaGo，在没有任何让子的情况下，以5:0完胜欧洲冠军、职业围棋二段选手樊麾。在围棋人工智能领域，实现了一次史无前例的突破。AlphaGo的下一个挑战对象是世界围棋冠军李世石。

2)自动驾驶汽车

近期，谷歌公司正在为无人驾驶项目大量招募人才。Google X团队负责谷歌的无人驾驶汽车项目。谷歌在无人驾驶汽车方面要领先于传统汽车厂商。2014年5月28日，Google 推出的无人驾驶汽车颠覆了人们对汽车的认识，和一般的汽车不同，Google 无人驾驶汽车没有方向盘和刹车，取而代之的是各种传感器以及软件系统。

目前，谷歌在加州山景城、德州奥斯汀，以及华盛顿州柯克兰测试无人驾驶汽车，测试车辆增加到55辆，并且累计行驶超过140万英里(约225万公里)。另外，谷歌无人驾驶汽车项目有望在今年独立成一个公司。

美国国家公路交通安全管理局(NHTSA)在一封信中表示谷歌自动驾驶汽车搭载的电脑可被视为车辆驾驶员。交管部门的表态将为谷歌自动驾驶汽车上路扫清最后的法律障碍，也是人工智能发展的里程碑事件。

3) 以Nest为基础的智能家居生态系统建设

2014年1月，谷歌以32亿美元收购了智能家居制作商Nest，该公司主要提供智能恒温器和智能烟雾探测器，旗下拥有上百项专利。2014年6月，谷歌通过Nest花费5.55亿美元收购了基于云端的家庭监控公司Dropcam，10月，又收购了智能家居中枢控制设备公司Revolv，该公司会参与Nest的开放计划“Works with Nest”。Nest在2014年年底推出了四款产品，包括一款室内自动恒温计、两款网络监控摄像头和一款烟雾警报器。

谷歌意识到智能家居领域将是未来人工智能应用的一个重要场景，所以通过一系列并购、开放平台的建立、软硬件一体化来建立这个生态系统，这一切的行动显示了谷歌在智能家居领域布局的前瞻性和决心。未来Google Now可以与Nest设备相连接，从而根据对用户行为的预测来为其提供更加贴心的智能家居服务，到那时，或许我们更能深切感受到科技所带来的巨大便利和温馨感。

4)图形识别和语音识别技术

2014年，谷歌开始了开发一套能够整合公司海量数据的语音系统，它将会使计算机从本质上“听懂”和“思考”人们向谷歌设备输入的语音。这个团队将前馈神经网络替换成了递归神经网络，提高了系统对语音信息的存储和处理能力，并能够使用上下文、物理定位及其它方式对谈话者的真正含义进行预测，高度模拟大脑再处理人谈话时的过程和反应。

谷歌语音团队已经更新了Google的语音搜索引擎算法--在深度神经网络技术的基础上进化成递归神经网络技术Recurrent neural network。Google Now语音助手可能是三家平台中最低调的，但是凭借谷歌其强大的大数据，知识库以及先进算法。谷歌语音甚至甚至能够识别喃喃低语并毫无延迟低自然处理语音指令，更新后其变得更加智能。

在图像识别方面，谷歌在2014年8月收购了一家图片分析公司Jetpac，并推出了人脸识别技术 FaceNet。Google研究院发表文章表示，未来Google的图形识别引擎不仅仅能够识别出照片的对象，还能够对整个场景进行简短而准确的描述。

5)总结

谷歌的使命是：整合全球信息，使每个人都可以访问和使用。为了实现这一目标，谷歌尽量覆盖更多的用户使用场景，从而获取更多信息，这只是初步的信息积累。同时，利用顶尖的人工智能技术对信息进行处理和反馈，将处理好的信息输出以提供更好的服务。这些应用在谷歌的产品中，为用户带来更加智能的生活体验。

百度人工智能

作为以技术为核心驱动力的公司，百度总裁张亚勤表示：人工智能是第四次工业革命的技术基石，百度将持续利用人工智能技术推动核心业务发展。

1)建立深度学习(DeepLearning)研究院，吸纳人才

百度自2013年成立全球首家深度学习(DeepLearning)研究院以来，通过吸纳众多全球顶尖专家，建成了全球最大的深度神经网络“百度大脑”，同谷歌、微软等企业争夺人工智能技术制高点。2014年，人工智能领域最权威的学者之一——吴恩达加入百度。目前，百度在语音识别、图片书别、传输、LBS、移动交互、3D照片还原等技术都已经处于全球领先水平。

2)百度大数据和开放平台

大数据是人工智能的基础，百度是全球最大的中文搜索引擎，在获取数据方面有天然的优势。2014年4月，百度发布了大数据引擎，百度大数据引擎一共可分为开放云、数据工厂和百度大脑三个部分，其中开放云提供了硬件性能，数据工厂提供了TB级的处理能力，而百度大脑则提供了大规模机器学习能力和深度学习能力，百度大数据引擎向外界提供大数据存储、分析和挖掘技术，而且在医疗、交通和金融领域有了具体应用。

2014年9月24日，百度在北京正式发布“智慧商业平台”，这是百度面向传统企业推出的智能数据合作平台，整合了百度大数据、百度地图LBS等一系列产品和技术，从而更好地在移动互联网时代为各行业提供一揽子数据和产品解决方案。

3)人工智能算法和云计算

百度大脑既需要人工智能算法，也需要云计算中心提供硬件支持。百度大脑通过深度学习来模拟人类大脑的神经元，参数规模达到百亿级别，构建了世界上最大规模的深度神经网络。

百度在国内拥有十几座云计算中心，为满足人工智能在计算和存储上的高要求，还投入使用了4万兆交换机，并在探索10万兆交换机。百度还是全球首家将GPU用于人工智能和深度学习领域、并规模化商用ARM服务器的公司。百度将这些整合在一起，就形成强大的存储计算能力，从而可以进行多样的并行计算，支持生成、配置针对不同应用和场景网络结构，从而为人工智能提供有力的硬件支持。

4)语音识别、图像识别和智能助手

近日，美国权威杂志《麻省理工评论》将语音接口列为2016年十大突破技术，百度硅谷人工智能实验室(SVAIL)最新的研究成果——新一代深度语音识别系统Deep Speech2位列其中。这也是本次评选入选的唯一一家来自中国科技公司的科技成果。《麻省理工评论》在文中评价说：“随着百度在语音技术方面的不断进步，语音接口变得更为实用和有效，人们可以更为便利的与身边的设备进行互动。百度的深度语音识别系统(Deep Speech 2)包含了一个非常大的、“深”的神经网络，它引入了数以百万计的转录语音。有时它在识别汉语语音片段方面，要比人为识别更加准确。”

2015年5月12日，百度超级计算机Minwa在一项以 ImageNet 对象分类为基准的人工智能测试中，图像识别的错误率仅为4.58%，超越了人类水平，同时也超越了微软和谷歌。据悉，百度超级计算机Minwa对包含100万张图片的ImageNet数据库进行扫描，然后自己学习如何将这些图片分成大约1000个不同的预定义类别。

在去年9月8日的百度世界大会上，百度董事长兼首席执行官李彦宏宣布推出全新的机器人助理“度秘”(英文名：duer)。度秘彰显了李彦宏在移动互联网时代一直的野心——让百度不再是一个寻找信息的最佳入口，而是越来越成为一个连接人与服务的入口。“度秘不仅是百度更新的产品，更是一种能力。”李彦宏强调，这种能力不仅会植入到手机百度和其他产品当中，也将开放给全网所有App，令“度秘”无处不在。

5)自动驾驶项目

百度在人工智能、机器学习领域的技术积累，以及对中国本土路况了如指掌，这将成为百度在自动驾驶汽车领域的优势所在。

2014年9月，百度宣布已经与宝马正式签署合作协议，共同研发自动化驾驶技术。其中，百度的三维地图及相关数据服务也将被融入宝马的车辆导航系统中，为自动驾驶汽车提供技术支撑，而传感器和控制驱动器等车辆系统则由宝马提供。

百度现在已经和一些城市的政府展开接触，计划在三年之内，在国内十座城市让自动驾驶汽车上路行驶。百度负责自动驾驶汽车项目的高级副总裁王劲也透露，今年将会在一些封闭的环境(比如会展举办地)，让一小部分用户体验百度的自动驾驶汽车。在过去三个月时间里，百度一直在和国内汽车制造商比亚迪合作，在对方的电动车上加装百度的AutoBrain系统(整合了汽车驾驶、道路环境观察等技术)。王劲透露，百度未来还可能和美国的汽车公司展开合作，不过他并未给出具体的汽车厂商名字。在王劲看来，AutoBrain系统是百度自动驾驶技术的核心产品。

总结

人工智能对于百度的意义不言自明，不断进化的人工智能技术将促进百度各项服务项目的完善，包括语音识别、文字语音、机器翻译、搜索引擎和广告平台。百度不仅关注无人驾驶、个人助手界面，同样重视垂类服务领域的智能技术开发，以期在未来能够广泛应用到金融、医疗等领域。

Facebook

Zuckerberg认为AI可以帮助人类提高生活质量，“我们不应该对AI感到害怕。相反的，我们应该对其中可能造福人类世界的美好的一面寄予厚望。譬如AI将能够通过诊断疾病来挽救生命，能够代替人类驾驶以创造更安全的环境。AI还能够在帮助人类找到新行星以及更进一步了解地球气候等领域实现突破。AI将能够在一些我们今天尚未想到的领域为我们提供帮助。”

1)成立人工智能研究实验室

2015年6月，Facebook人工智能研究中心(Facebook AI Research，简称FAIR)在巴黎成立实验室，以挖掘欧洲的人工智能人才，建造能够理解海量数据的人工智能机器。该实验室有理解婴儿语言学习等项目。同时，Facebook还招募了图像处理、文本分析、语音识别及实施战略游戏领域的专家。Facebook的另外两个人工智能实验室分别位于美国纽约和加州的门洛帕克。2015年7月，外媒报道称Facebook 正在开发代号为“Moneypenny”(简称M)的人工智能助理项目，该项目已展开内部测试。该人工助理运行于 Facebook Messenger内，类似 Cortana、Google Now 和 Siri，但它会对接人工客服，为客户提供商品查询和购买等服务。

2)Facebook人工智能已经可以理解儿童故事

2月19日，Facebook公布了用于训练人工智能软件的数据。Facebook的人工智能软件能理解儿童故事，并预测语句中缺漏的单词。这一数据集的大小超过1.6GB，是此前发表的一篇相关学术论文的附件。Facebook CEO马克·扎克伯格介绍了Facebook的这项研究。

“对计算机来说，语言是最难理解的一类信息。......以往，计算机可以预测简单的单词，例如‘on’或‘at’，以及‘run’和‘eat’等动词，但计算机无法预测类似‘ball’、‘table’，以及人名等名词。”“在这项研究中，我们的团队教会计算机去分析语句的上下文，从而更准确地预测某些困难的单词，例如名词和人名。这通常是语句中最重要的部分。通过分析适当的上下文，计算机可以做出最准确的判断。这样的上下文不能太多也不能太少。我们将这称为‘金凤花原理’。”这一数据集来自“古登堡项目”中的图书，未来将被提供给学术研究机构以及其他公司的研究者。这将有助于优化应用的语言理解系统。

3)围棋人工智能

1月27日，Facebook创始人扎克伯格在自己的脸书上敲了这么一段：“……科学家们已经花了20年教电脑兄下围棋，现在我们马上要实现啦 (We’re getting close)。在过去半年里，我们所创造的AI只用0.1秒就走一步，效果与以前那些几年才设计出来的系统一样好……”

Facebook去年11月就介绍了代号为黑暗森林的围棋人工智能系统。对战人类棋手时，黑暗森林2可以达到业余三段水平;通过7.5万次运行后，则可以在KGS服务器上稳定保持在业余五段水平。

4)Facebook 运用 AI 建置人口分布图

为了让全球未有网络可用的偏远地区人口能够上网，Facebook 不断研发新连网技术与平台以提供无线网络服务。最近 Facebook 更运用人工智能(AI)建构人口分布图，精确分析地区人口密度，有助 Facebook 判断最适合该区的连网方式。

总结

在人工智能领域，Facebook下手比较晚了，谷歌、微软公司都已经在人工智能和机器学习领域长期投资，Facebook必须下大力气追赶这些对手。作为一个社交网站，Facebook会产生大量数据，而社交网站中的诸多功能，如新闻排序、图像识别等都涉及大量的数据处理，Facebook的运转依赖着大量人工智能技术的支持。Facebook人工智能研究的课题涉及到视频内容分析、智能回答问题、识别图像中的人物和物体，自动生成图片样本等等，这些无疑可以让Facebook用户得到更加完美的用户体验。

IBM

IBM 沃森负责人David Kenny说：“我完全相信人工智能将会是我们有生之年最重要、最具影响力的技术。互联网在连接人类和信息方面取得了巨大进步，现在，人工智能将会把信息转化成更好的决策，激发新的灵感，让专业知识更普及。”

1)IBM华生超级电脑能从你写的文字中识别出情绪

人工智能的一个发展方向是识别人类的表情，比如家庭中的机器人，可以识别主人目前的情绪，主动提供某种服务等。最近，IBM在情绪识别方面也做出了突破。其对华生超计算机算进行了软件升级，安装了最先进的“语气分析工具”(Tone Analyzer)，这一工具可以对人类的书写文字进行智能识别，识别出其中的高兴、悲伤等情绪。

华生电脑甚至可以识别出用户的性格特性，比如是内向还是外向。另外其分析工具能够分析整个的句子，而不是零散的几个单词。如果能够识别出用户的情绪，华生电脑自然也能够做出更有针对性的应答服务。比如通过语音文本转换工具，华生电脑可以以恰当的语气语调回答问题。比如如果某个用户当前的情绪属于愤怒状态，则华生电脑也不会采用兴奋激动的语气回答问题。

IBM的这一成果表明，未来的人工智能将不会是一种冷漠的技术，它能够识别人类的各种情绪，从而做出更加类似于人类的回应和反馈。人工智能的另外一个热门领域是人脸或者图像识别，计算机能够通过人脸面部特征分析出情绪信息。如果这种人脸识别能够和文字表情识别进行结合，意味着华生电脑等工具，将变成一个完全功能的“智能人”，而不再是一个简单的办公工具或者会做饭的机器人厨师等。

2)设立全球人工智能竞赛奖项，鼓励人工智能发展

近日，X Prize基金会和IBM在TED2016上联合宣布，将共同启动一项总奖金为500万美元的全球人工智能竞赛，这项竞赛被称为「IBM 沃森人工智能 XPRIZE：认知计算竞赛」。此项竞赛将邀请全世界的团队借助人工智能的力量来集思广益，共同寻找地球上几个最迫切问题的答案。这是IBM继续推广其认知计算的新计划。

过去几年，IBM一直在努力推广以沃森为主的人工智能和认知计算，推出沃森开放平台，并在2014年为此投资了10亿美元，以将自己的认知计算推广在更多的商业领域。截至到目前，沃森已经在医疗、金融、科学研究等方面有了深入应用。

总结

IBM作为一家信息技术和业务解决方案公司，比起上述科技巨头来讲，它更加侧重为企业提供基础服务，所以它的研究方向也更加偏向于企业应用领域，比如它研发出的超级计算机深蓝和沃森。IBM长于制造各种复杂的机器，除了服务器还有这种智能计算机(小型机的集群)，基于超级计算机研发出的系统可以应用于不同的领域。对于IBM来说，超级计算机未来不仅要继续挑战人类智能的极限，还要帮助这家公司去同亚马逊、谷歌、微软们竞争，争夺未来科技制高点的主导权。

从上述几家公司人工智能的进展中也可以看出未来人工智能的趋势，首先是弱人工智能已经渗透到我们生活的方方面面，比如声音识别、图像识别、大数据和云计算的应用，自动驾驶汽车和智能家居的研发，然而巨头们并不满足于此，它们在通往强人工智能的路上仍不懈努力着，希望能够研发出更加接近人类大脑的人工智能，即像人一样思考或推理或者完全有自己的一套思维体系，这听起来有点儿恐怖。但不管你对人工智能是支持、反对抑或恐惧，都无法否认这样一个事实，人工智能的应用已经并将继续对世界产生不可思议的影响。