新闻
中国节能网

格灵深瞳董事长赵勇:未来人是机器的主人 机器是人的奴隶

   2015-12-14 财经网2430
核心提示:我的预测是,未来人是机器的主人,它们是我们的奴隶,我们要训练非常好的奴隶给我们工作,我们人主要的工作就变成训练他们。12月13日,北京格

“我的预测是,未来人是机器的主人,它们是我们的奴隶,我们要训练非常好的奴隶给我们工作,我们人主要的工作就变成训练他们。”12月13日,北京格灵深瞳信息技术有限公司董事长兼CTO、GoogleGlass团队核心成员赵勇如此表示。

赵勇表示,英特尔、微软、苹果、华为、阿里巴巴、谷歌、Facebook这些公司成功的规律是在正确的时代做了正确的事,而未来IT产业的发展的方向将是人工智能。

而在人工智能领域,过去三十年最伟大的一个进展深度学习,另外一个重要进展则是传感器领域。

赵勇谈到,除了在好莱坞电影中关于人工智能的想象外,现实生活中已经有一些人工智能的发展尝试,包括谷歌眼镜、微软Cortana语音助手、无人驾驶等。

具体到无人驾驶方面,赵勇表示,目前已经证明可以靠视觉系统造出行车电脑,用三维的方法,实时计算出目前行驶的轨迹,包括可以生成俯视图,计算出车周围的环境是什么样的。

“未来五到十年(自动驾驶的车)就会跑在全世界的道路上,包括中国的道路上。”赵勇表示。

而人工智能到底何时才能真正改变我们的生活,赵勇给出的答案是十年,甚至二、三十年。

赵勇最后还表示,在人工智能行业的发展上,应该有些边界,比如不能进入武器的领域;在情感和社交方面,人工智能牵扯的越少越好,变成工具就行了,不要跟人类谈恋爱。

以下为赵勇现场发言实录:

主持人武虹:今天我们请的发言人北京格灵深瞳信息技术有限公司董事长兼CTO、GoogleGlass团队核心成员赵勇。今天他带来的主题是让大家看到未来智能发展的方向是什么,跟我们是什么样的关系?有请他上台作主旨演讲。

赵勇:大家好!我是一个计算机工程是,今天受邀来到一个财经论坛,对我来说是个很大的挑战。我看到昨天的议题,比如金融、货币、政府、外交,感到没有什么共同语言。我自己从工程的角度来看工业界,在过去50年,从1965年到今年,新诞生的超过千亿美元市值的民营企业,只有17家。在这17家里面除了最下面一排四家公司,全部都是IT企业,也就是说有13家IT企业。在过去半个世纪推动整个经济社会向前发展的主要新动力一定是IT科技,是毫无质疑的。

在67、68年分别成立了因特尔,他们都是半导体公司。到了70年代,几乎扎堆成立了四家千亿美元公司,分别是微软、苹果,他们是做计算机软硬件的。到了80年代,有华为等。这几家公司都需要做网络和电信,当我们有了计算机,需要把它们连接起来一起工作,网络和电信是最重要的。到了90年代,有了网络,有了因特网,用他们干什么,历史证明,最成功的应用就是零售。可以看到98年阿里巴巴成立,他们把零售带上了因特网,经过十几年的奋斗,现在对我们的影响已经非常大了。到2000年,谷歌、Facebook把社交等等带到了因特网上。所有因特网的服务和商品都可以借助这个平台影响到每一个人,这是非常非常重要。

可以看到两个规律:第一,在什么时代做什么事情是非常重要的。这些公司之所以成功,是因为他们在正确的时代做了正确的事情,而且他们都是他们所在领域的先驱,如果晚十年再做这些事情的话,恐怕就很难成功了。至少我们没有看到一个成功的例子。未来是什么呢?我的答案是人工智能。今天我想给大家普及一下什么是人工智能。媒体上对人工智能有好多渲染,有时候神化了它,有时候妖魔化了它,我希望通过我的介绍大家对人工智能有一个比较真实的理解。

这张屏幕上显示的一个普通工程师工作的画面,这个画面上的每一行字就是一个指令,这叫编程。今天为止,大部分计算机都是用编程的方式工作的,我们给一条指令,再给一条指令,计算机就严格地按照指令序列执行任务。计算机其实是很笨的东西,它们只是执行我们的命令。从计算机发明到现在一直是这样工作的,但是我们越来越看不到一个前途,未来的计算机怎么变得比人更聪明。我有一个导师做了一个研究,他想扫描真正的人脑,下面我给大家展示一下这套系统扫描出来的人脑是长什么样子的。这张画面上显示的人脑是一平方毫米里的神经原的图像,无论一个人的智商怎么样,脑子里大概有两千亿到四千亿的神经原,这些神经原相互联结在一起形成了我们人脑的活动。有一个非常伟大的机器学习的方法,叫神经网络的方式,就是用纯软件的方式模拟一个类似于神经网络结构的数学模型,这个模式就是我们所说深度学习的模型,当我们教他们什么是猪,什么是狗,这就是训练的过程。深度学习是过去三十年,在人工智能里最伟大的一个进展,另外一个进展是传感器领域的进展。比如视觉系统,在过去几年最重要的成就就是深度传感器,它们可以把这个世界的三维结构扫描起来,比如可以用在自动驾驶汽车里面,用在人机互动的应用里面。 现在给大家看几个好莱坞想象的机器人是什么样子,这些经典的形象都来自于若干个不同的电影。好莱坞很有意思,好莱坞几乎很棒的科幻的电影都是科学家,这些人基本上在好莱坞提前实现了梦想。这个机器人是一个服务机器人,人类发明出来放在工厂里,放在餐厅里,放在军队里,为我们服务,直到有一天他们发现自己被欺负的太恨了,就闹起来了。

这张照片显示的是宝马公司在欧洲的一个生产线,宝马七系列的轿车在这里被生产,在这个生产线上只有5%的工序是由人完成的,其他的工序全部是由机器人完成的。为什么一定要用机器人来完成?是因为德国的工人太贵吗?并不是这样。为了造一辆汽车,它可以跑的很快,质量非常好,很稳定,可以连续使用20年,对工艺的要求非常高,只有机器人可以做到。

上面两张图是国内某家电商的仓库,我们在网上买东西的时候看到很多网页,非常简单,但背后是巨大的仓库系统,这个仓库有四五个足球场那么大,里面有近万个年轻的农民工们推着小车在里面飞驰着奔跑,不停地把客户的订单从成千上万的货架上收集起来。在亚马逊的仓库里没有人,所有都是机器人。在今天的亚马逊,绝大多数的物流中心都已经使用了这套系统。

这个机器人,大白非常可爱,它是个医疗机器人,主要的目标是做体检,有什么问题给你迅速进行医疗诊断。这个功能非常非常发达。

这个机器人可以给人动手术,这是件很棒的事情。我们往往都希望找一个老医生,他的经验最丰富,最好,但是当我描述下一个情况的时候,你可能会改变你的想法。大概在十年前,在哈佛医学院有一个病人,他当时还没有出生,但已经早期被医生判断得了先天性的心脏病,需要动一个手术,这个孩子当时只有29周,医生提前把他取出来,给他动开胸的手术,所有的一生都不敢接这个活,因为他们手指的精度达不到这个要求。在这个机器手术刀上有一个镜头,捕捉了画面,传递给医生。医生在虚拟的手术刀上工作,它的手指的动作传到心脏上,由更加细微的机器手臂进行操作。到今天,它还可以给成人动手术,代替开胸手术。有的时候一个手术需要在心脏上动刀,并且有缝合,首先把病人麻倒,把胸腔打开,打开胸腔的过程其实是一个非常残忍的过程,心脏是跳动的,没办法在跳动的心脏上动手术,想一个办法把心脏弄停下来,然后医生动刀。这个手术对病人的伤害是非常大的,今天达芬奇机器人怎么做呢?他们把手术刀、相机、光源通过微创的方式,直接伸到体内看到你的心脏,这时候看到了一个跳动的心脏,医生是没有办法在跳动的心脏上动手术的,但是它有一个速度非常快的摄像头观察这个心脏。用1000桢每秒的速度跟踪这个心脏的跳动,用虚拟手术刀在画面上动手术。这是一件很伟大的事。

这个机器人叫终结者,它是用来杀人的,很不幸的是人工智能最先的应用就是在杀人的武器上。我们今天知道,已经有很多机器人会杀人了,比如侦查飞机,一些地面作战的车辆。

这是两年前的一部得了奥斯卡奖的电影,这个机器人并没有形状,她就在这个人的口袋里,像手机一样。这个机器人可以看到主人公看到的东西,听到主人公听到的东西,保留了主人公所有的通信。本来设计成一个电子助手,因为它知道主人所有的事,慢慢的就跟这个主人发生了感情的交流,这个主人甚至后来爱上了它。

我们看看现实的生活,我在几年前参与了一个项目,规划这个项目的时候,我们希望能发明一个计算机,它就待在人的脸上,看到你看到的东西,听到你听到的东西,连接到互联网,互联网上有你所有的通信资料,有你所有的笔记,有你所有的照片,还有整个互联网上无所不用其极的所有的知识库。我们希望发明这个设备未来能够成为人很好的帮手,最开始的时候它的名字叫“僚机”。我自己在研究生的时候,有个同学在网上跟很多女孩聊天,不停地用百度搜索知识,成功地吸引了很多女孩,问题是每次约会的时候都是见光死。当然我们并没有成功,因为我们的计算能力,在谷歌眼镜的时代,都不能达到实用的状态。但是我知道谷歌还在继续投入更大的力量研发这种产品。 这个视频描述的是这个眼镜工作的状态,这个人每天早上起来,这个眼镜告诉他天气怎么样,会告诉他今天应该去什么地方,提醒他。在整个过程当中,他只要说话就可以了,就好像跟自己的朋友交谈一样。他坐地铁,系统告诉他说这个地铁停了。在这个过程中,他通过指引看到了一个海报,海报说有一个音乐会,他可以立刻买票。他看到一张很有趣的海报,他说这张照片太酷了,他说你给我拍张照片,这个事情他的眼镜立刻就帮他做好了。

微软也在做同样的事情,微软发布了一个助手,叫Cortana。微软研究院的同事正在研究让Cortana跟人聊天。

聊了那么多有趣的事情,我想告诉大家,不是每个机器人都必须是一个人的,它在我们的行业里可以做很多事情。比如我们公司做了这么一款摄像头,它可以看懂人在干什么。哪怕是在一个非常拥挤的环境里,这个画面里有30多个人,我们去检测、识别,并且记住每一个人,然后记住他们长什么样子。现在这个产品已经放在银行里使用了,帮助银行了解营业厅里客人的秩序,行为,在夜间的时候有没有发生砸机器的情况。在银行的金库里,有一个设备,打开之后里面有80万元的现金。在很多敏感的地方,我们可以帮助员工去看工作的时候每个操作是不是符合要求的。我们有些合作伙伴用它放在博物馆里,研究观众对哪些作品更感兴趣,有些客户把它放在学校里,观察老师跟学生的互动,有些客人把它放在监狱里。真的是五花八门,最近甚至有些客户说把这个东西装到数据中心里。

我们在汽车上做了一些事,今天我们有很多车了,慢慢看到了汽车的一些缺点,比如安全问题、污染问题、拥堵问题。我们要解决这个问题最重要的就是让汽车变得越来越安全,我们想设计一个人工智能帮我们开车。用人工智能开车的基本任务,第一是定位和导航,第二是防止碰撞。第三是对交通环境进行感知与互动。这个动机最早在美国的军事领域产生的,美国国防部要求大家开一个车,在越野的环境里自动的完成一个任务。这辆车是斯坦福大学的车,这辆车也是今天谷歌汽车早期的原形,这个车上装了很多传感器,这些传感器都是用在以前用在军方的非常昂贵的传感器。今天的汽车装的传感器系统,光传感器的原件基本上都超过200万。

我比较困惑的一件事,人可以开车,我们没有高精度的雷达,我们是怎么做的,就是靠我们一双眼睛和很好的脑子,我始终相信通过图像处理就可以很好地完成自动驾驶。我们的愿望是能够通过简单的摄像头系统和一些低成本的GPS,完整的完成自动驾驶的任务。我们通过视觉可以算出来三维结构,它可以把图像信息转化成下面显示的深度信息,每一个颜色代表的是距离,通过这个系统基本上可以探测出来障碍物在哪儿,其他的行人在哪儿。我们在道路行驶的过程中,非常精确的检测每辆汽车和行人。我们通过视觉同样可以判断轨迹,你的速度是什么,你的加速度是什么。过去这些事情必须用高精度的灌导来做,GPS的确定是不精确,有的时候会跳动,当你在大楼底下或者在桥底下的时候,它的噪音会更加大。我们已经证明可以用视觉的方式通过画面的变化来判断出我们的轨迹是什么。这个东西的成本是很低的,很可能跟你的手机一样。把这些东西都加起来,纯粹可以靠视觉系统我们可以造出这样的行车电脑,他们用三维的方法,实时计算出目前行驶的轨迹,包括可以生成俯视图,告诉你这个车周围的环境是什么样的。 这张图显示是一个意大利的设计公司,他们不造车,但他们造视觉概念。我展示一个特别憧憬的未来。未来我们的汽车可以选择自己开,也可以选择让计算机来开。当你选择让计算机来开的时候,在这个车上就会变得很自由,可以休息,可以看电影,可以工作,可以进行商务会谈。在长途旅行的时候,也不用担心自己可能会不小心睡着。我非常欣赏这种概念的产品,我非常确信,这样的产品应该在未来的五到十年就会跑在全世界的道路上,包括中国的道路上。

在我们做汽车项目的过程中,接触了很多交通事故的信息,我惊讶地发现,有超过85%的致人死亡的事故,都是发生在十字路口。为什么十字路口危险呢?即使你遵守了所有的交通规则,但有另外一个人违规的时候,你就会被牵扯进来,而这种危险你是提前看不见的。因为人的眼睛职能看到光鲜,而光是直线传播的,来自一个拐角的危险我们是无法提前预知的。我给大家看一个最经典的例子。当我们反思这个事故的时候,发现没有任何方法来避免这个事故,因为你是绿灯,看不到前面有任何障碍,开过去了,这个事情就从天而降了。如果我们想避免这种事故,靠车是不行的。我们有一个方案,就是在十字路口的每个方向装一个摄像头,实时检测和跟踪每个人每一辆车,并且把他们运动的信息可以实时传出来,如果每辆车对自己做一个定位,他就可以预测这种事故的发生。

我们有一套给交通管理系统使用的视觉的管理系统,这就是做汽车的检测和跟踪,还有识别。对汽车的识别过去可以做的是车牌号码识别,但我们的客户说这个还不够,他们发现真正的犯罪分子是没有人用真的车牌号码的,他们还要深度识别这个车的颜色、生产厂家、型号、哪一年生产的。于是,在我们的桌前就放了5000多种不同型号款式生产年份的组合,这在以前是无法想象的,随着神经网络的发展,我们可以在短短几个月的时间内完成这个任务。

我们公司是在两年多前成立的,当时我回到北京在一个民宅里找到一些年轻人,开始做一些有趣的实验,我们发展的非常快,在过去的两年里获得了很多资本和媒体的关注。我们的新闻联播很有意思,在我们公司才两三个月的时候,就钻到民宅里采访我们,当时我们非常惊讶,说明我们国家队创新非常重视。在这两年里,我们的团队慢慢成长起来,我们收集了中国和美国最好的人才,跟我们在一起把人工智能慢慢从一个幻想变成现实,这是我们现在的办公室。我们在北京找了一个非常有趣的地方,国家和社会对一个创业企业来说是多么的支持,我们今天在北京找到了一个非常漂亮的地方,去做我们的创新。

最后我跟大家分享一张照片,每当我想到人工智能现状的时候,这张照片是最能表达的。我们现在应该是一个漫长的黑夜即将结束前的黎明快要到来的时候,最近有很多大公司,很多基金,都因为人工智能做了很多的动作,产生了很多的产品。我们真的非常需要这个社会更多的投入,无论是资本、人才还是政策。我今天还要表达另外一件事情,还有一个更重要的资源就是耐心,任何伟大的创新不会一蹴而就,对于我们来说,这个行业已经发展了四、五十年了,到今天开始出现一个井喷式成长的状态,即使如此,我个人认为,我们还需要花很多钱和很多人的青春在这里面投入十年,甚至二、三十年的时间,才能实现我刚才讲到的很多创新,才能真正改变我们的生活。这就是人工智能。谢谢!

主持人武虹:谢谢赵勇精彩的演讲。因为每一次听他的演讲,都让我感觉到脑洞大开。赵勇刚刚给大家普及了一下什么是人工智能,以及人工智能在各个方面的前沿的技术。人工智能能够像人一样学习的话,现在有一句非常流行的话,是不是再过十年、二十年,真的机器人就比人聪明,你怎么看这个事情?

赵勇:我自己在做机器学习,我很难想象有一天机器在各个方面都比人聪明。人工智能有低层智能、中层智能、高层智能,人工智能的确在一些简单精确的任务上,已经比人做的好了,我的预测是未来,人是机器的主人,它们是我们的奴隶,我们要训练非常好的奴隶给我们工作,我们人主要的工作就变成训练他们。在人工智能行业的发展上,应该有些边界,比如我非常支持人工智能不能进入武器的领域,因为这个世界上有很强的贫富差距,也有很强的科技发展的差距,如果一些特别富有的国家,科技非常进步,可以使得战争没有任何代价。在情感和社交方面,我反而希望人工智能牵扯的越少越好,变成工具就行了,不要跟我们谈恋爱。

 
 
更多>同类新闻
推荐图文
推荐新闻
点击排行
网站首页  |  关于我们  |  我们宗旨  |  我们使命  |  我们愿景  |  组织机构  |  专家机构  |  机构分布  |  领导机构  |  管理团队  |  联系方式  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  京ICP备050212号-1