中国人工智能学会

Chinese Association for Artificial Intelligence

GAITC 2016 演讲实录丨张代君:人工智能中的虚拟现实

发布时间:2016-05-11

人工智能中的虚拟现实

Virtual Reality in Artificial Intelligence


11.png

张代君

三星电子中国研究院院长


以下是张代君的演讲实录:

我很高兴参加今天的活动,在人工智能60周年纪念的特殊时刻,能跟各位同行共享这份报告。

22.png

过去人工智能60年的发展,尤其最近10年的发展,让我们看到了语音识别、手写文字识别、人脸识别这样的传统识别技术,在大数据的引导下逐步商业化并已经形成了一个很大的风口。这60年间经历了人工智能的三次发展高潮,可能由于没有进行标准化,人工智能的发展还处于比较初级的阶段。我们认为当下是人工智能的第三次高潮,还将会有第四次的到来。

以我们非常熟悉的移动通信为例,移动通信的历史只有40多年。40多年后的今天,有报告称移动用户的SUBSCRIBER数量已经超过了全球人口数量。从移动通信的发展来看,每十年进行一次标准化的迭代。现在4G已经商用化,正在开发5G,所以移动通信的发展是比较快速的。在2G数字移动时代,我们就认为2G已经非常精彩,可以全球随时随地移动通信,而现在我们感觉4G移动高清视频高速数据传输似乎到达了极致,但其实这并不是终点,未来还会有5G、6G等等。同样的,目前的人工智能处在第三次高潮中,接下来还会有第四次以至于更多。

人工智能的架构需要技术来支撑。前面发言的专家讲到,除了各类模式识别技术,深度学习和大数据分析之外,我们还需要计算能力。我们以前有CPU,现在又有了GPU,在AI人工智能的时代,会不会需要一个专门针对人工智能计算的APU(或者AIPU)?我想在支撑人工智能发展的过程中,可能需要专门的APU/AIPU芯片。

33.png

今天人工智能的发展,也离不开移动终端的发展;此外我们需要专门的操作系统。只有随着这样的技术发展和结合,我们才能够去改造已有的业务。

人工智能并不是平地起高楼的技术。它不仅会带来新的设备,比如说VR眼镜,还会改造已有的产品和服务。

人工智能为什么发展那么火热?我想原因之一是不同的产业群体在这里能看到不同的商机。以三星电子为例,我们首先要改造已有的设备。比如说家电设备,让传统家电体现智能性这方面,今年1月份的CES上,我们率先发布了Family-Hub智能冰箱。当你在厨房里,消耗五分钟喝一杯咖啡的时候,和这样一台智能设备相处,它不仅是一个冰箱,还可以识别管理你的食物,进行大数据的处理分析和健康饮食建议,甚至进行通信和人机交互、 厨房娱乐等。这就是一个我们改造已有的传统家电的例子。此外我们在美国收购了SMARTHINGS并据此构筑一个智能家居的公共服务平台,基于这样的开放式平台,我相信未来的smart home会非常精彩。

未来人工智能还会改造传统汽车行业,最近智能汽车也甚是火热,我相信这个风口也是很多人看重的。三星在2016 巴塞罗那世界移动通信大会上宣布将与爱立信, IBM, AT&T等企业建立ConnectedAuto合作体系。人工智能将会改造传统的行业,早准备、早起步的人将有机会。

与此同时,人工智能当然也会产生新的服务。比如我们实现语音识别S-VOICE,每个人都可以有一个智能语音生活助理;移动智能健康S-Health 进行大数据处理以后,每个人都可以有一个智能健康生活助理,具有智能提醒功能的个人智能助理使用范围越来越广泛,这样的新服务领域,是人工智能带给我们的红利。

人工智能还会带来什么呢?VR。有人说2016年是VR元年。VR所带来的交互视听体验是全新的,是由人工智能带来的新机会。

人工智能所需要的技术包括语音文字、人脸图像等多模态的识别、以及深度学习、大数据分析等。此外人机交互能力也很重要,今天的VR改变了人类的交互体验。

前面所说的一切都需要媒体视频数据格式处理的能力。不仅是4K、8K,甚至要做到16K,发展是永无止境的。现在4K是有线高清视频显示的主流,2K是移动高清视频显示的主流。而未来的主流,在VR/AR的时代,高质量3D全景内容就需要16K视频显示分辨率。以半导体的发展来看,摩尔定律并没有完全失效。观察SOC的集成速度, 2018年SOC集成晶体管的数目将会达到人脑神经元的相当数目,300亿颗。孙正义在今年世界移动通信大会GTI峰会上大胆预测在2040年,SOC的处理能力将是现在的100万倍。这样的处理能力拿来干什么?人工智能的发展要改造传统行业,我们今天的传统行业是什么?就是一些传统的设备,比如家电设备、办公设备等等,都会借此成功升级为智能设备。在这里我们需要专用的人工智能芯片、专用的IoT操作系统,来连接所有的物联网设备。三星电子和INTEL合作推动了TIZEN这一先进物联网操作系统,助推IoT产业发展。

AlphaGo打败了围棋世界冠军, 使用了1920个CPU, 280个GPU。如果未来有一天,基于手机或者物联网设备的计算处理能力能打败世界冠军,那么今天的物联网设备还有很大的发展空间。另外,以VR为例,VR设备通常是移动的,这就涉及到网络通信能力,需要让传输时间大幅的缩短,5G通信可以缩短端对端时延1毫秒。所以这些技术能力的提升将会支撑整个人工智能的发展,而不仅是依靠识别算法的进步。

今天我们的报告侧重于在人工智能背景下VR的发展。电视诞生以来,我们已经看了七八十年,习惯了传统的视听交互。而现在,VR将真正的改变人类的视听体验。VR的内容可以来自于传统的设备,比如普通手机拍摄的内容。但是这些还不够,需要一些新的内容生成,比如360度的2D/3D全景视频,这种内容的沉浸式体验对人们是很有冲击力的。

我们以前使用短信,现在使用微信秀文字、图片、视频。还有一种新方法是采集VR的内容,在社交媒体上分享给你的朋友,通过VR设备进行观看。你可以亲自采集,甚至编辑VR内容。

今天对VR产品的认识,更多的是VR头盔。但还有一种非常重要的设备,就是可以拍摄360度影像的内容生成设备。使用这种便携的2D/3D全景摄像头,我们就可以在游泳、滑雪、坐过山车的时候,在空中、在水下拍出来非常精彩的VR视频大片。

三星电子在2014年发布了业界首款VR眼镜,具有96度的FOV,16.7毫秒的低延时,而且非常轻便。今年的世界移动通信大会上,第一次有5000人同时使用VR观看同一个内容,这个场景是非常震撼的。另外,会上我们还发布了一个Gear 360全景拼接摄像头,非常小巧,可以做到4K视频的360度拼接,会给消费者完全不同的VR用户体验。

我们看到由这个全景拼接摄像头拍摄的全景视频,既能看到水底,又能看到水面上和周围,非常有趣。我想这就是人工智能在人机交互方面的一个典型应用。

今年只是VR元年,目前我们可以戴着VR眼镜10分钟,但要做到持续使用两个小时甚至更长,还有很多的路要走。还有如何实现自然的人机交互,如何提供高质量的内容和高质量的硬件(市场上1K FHD手机屏幕根本支撑不了VR的良好用户体验),都是需要继续研究的问题。今天VR的行业标准出来了(时延低于20毫秒,屏幕刷新率75赫兹以上,以及1K以上的陀螺仪刷新率),这是一个很好的开端。不过,今天的VR有很强的局限性,因为VR是隔离于现实的、是完全的虚拟世界。

所以我觉得VR的未来将是AR。AR通过穿透式的显示,解决眼睛的疲劳,将真实的世界引入到视线里来。大家可以看到AR已经在教育等B2B市场有一些商业化的例子了,但AR的发展可能相对会慢一些。在技术上,我们需要在实时的人机交互方面取得进展,比如使用六自由度的高精度摄像头的姿态跟踪,实时的物体检测、识别、跟踪等等。这样,AR的视听体验会更加舒适友好。所以现在的VR是一个阶段性的成果,还有待于完善,而它的未来在于AR。

VR正在重塑人机交互,和改善人与环境的交互,使我们能够参与到未来的虚拟世界当中。随着进一步的发展,VR与AR的界线将会变得模糊, 混合现实将是未来的形态。

我们希望在人工智能和虚拟现实的发展中做出贡献,但要实现这样的变革,不仅需要三星电子,更需要来自各个高校的专家学者,和来自产业界的朋友共同合作,促进整个的产业链的发展,形成对AI,对VR/AR的强大推力。在过去的几十年当中,我们沿着电视、手机和平板这样的交互形式发展,但今天VR会彻底改变我们视听体验,改变我们的交互方式,而现在只是刚刚开始,未来随着人工智能技术的发展,VR/AR会获得新的更大的施展空间。谢谢大家!

(本报告根据速记整理)

CAAI原创 丨 作者张代君

未经授权严禁转载及翻译

如需转载合作请向学会或本人申请

转发请注明转自中国人工智能学会