中国人工智能学会

Chinese Association for Artificial Intelligence

CCAI 2020 演讲实录丨韦峻青:《数据驱动自动驾驶AI安全落地》

发布时间:2020-09-25

8月29日至30日,由中国科学技术协会、中国科学院、南京市人民政府为指导单位,中国人工智能学会、南京市建邺区人民政府、江苏省科学技术协会主办的主题为“ 智周万物 ”的2020中国人工智能大会(CCAI 2020)在新加坡·南京生态科技岛举办。在8月29日举办的智慧交通专题论坛上,滴滴自动驾驶公司首席技术官韦峻青博士为我们带来了题为《数据驱动自动驾驶AI安全落地》的精彩演讲。

韦.png

韦峻青

滴滴自动驾驶公司首席技术官

以下是韦峻青的演讲实录:

今天想和大家探讨的题目是《大数据驱动自动驾驶安全落地》。涉及到两个点,一是数据,数据怎么帮助一个AI系统;二是AI系统怎么能在safety critical的应用里安全落地,让公众所认知。

 滴滴做自动驾驶的初心与ADAS系统、自动驾驶很多公司初心都一样,看到非常多生命在交通环节中的损失。2018年,每年有130万人死于交通事故,相比航空事故死亡率很低。从出行的角度,滴滴希望不管是通过出行网络更好的调度,以及通过对人类驾驶员更好的监管和更好的提示,还是通过自动驾驶技术,根本性地解决人类出行安全性和效率上的问题。

滴滴做了哪些事情?

我们打造了全栈L4级解决方案,包括核心的AI技术,比如感知、预测、规划、控制,包括支持这些模块所需要的地图、定位,还有云端系统,以及基础架构、硬件、操作系统,这是一套非常复杂的体系。滴滴用过去三四年投入几百人的工程师力量,打造了这套体系。

现在遇到一个问题,AI已经做好了或者已经打造了一个非常好的平台,下一步怎么能够给AI这台发动机足够的燃料,让它能持续、自动迭代,变得更好,并且能够做到像Google brain一样。公众期待自动驾驶要比人安全很多,或者永远都不出现事故或出现非常少的事故,怎么做到?就是自动驾驶AI在接下来一段时间变成并非算法的竞争,而是数据的竞争,数据的量和质决定自动驾驶系统或AI系统的上限,尤其是安全的上限。

滴滴收集了哪些数据?

自动驾驶系统中间是AI系统,两边是数据驱动,希望这些数据和场景能让自动驾驶的驾驶员做到见多识广和千锤百炼。

在滴滴网约车平台上,为了乘客安全,也是为了滴滴自动驾驶技术的演进,在全国网约车上安装了桔视设备。桔视是一个智能终端,有前向摄像头可以看到车外场景,以及后向摄像头可以看到车外和车内的场景,其数据链路和滴滴云打通,通过桔视来发掘路上一些场景、一些case或路口。如果只关心这个路口,可以把所有滴滴网约车通过这个路口的数据都提到云上,目前已覆盖了全国300多个城市。

部署这个设备,不仅是为了乘客安全,更重要的是希望它能对整个自动驾驶行业的将来起到比较大的推动作用或决定性的改变作用。

案例

比如,在路上见到鸟、鸡、狗动物,以及三轮车和轮椅(逆行),这些场景对自动驾驶公司如Waymo,有五六百万辆自动驾驶车,一年积累1 000万数据里只有10~15个类似场景;但是滴滴,的网约车司机每年会积累1 000亿公里数据,在云端做数据的挖掘,可以找到非常多的边缘场景、交通者的特殊性,这样在构建深度学习网络,或有针对性对偏高频、偏高危场景进行深度开挖,这是一个优势。

即使普通的交通参与者,比如车、人也有特殊性。这是一个桔视采集的数据,卡车为了躲避马路中横穿的行人,转向自动驾驶的车辆,现在系统容易出现急刹、急打方向盘的危险情况,如果我们能收集到各种各样的交通参与者的特殊性,就可以不断在云平台上、仿真平台上打磨自动驾驶系统,让它变得更安全。

我们构建的技术优势就是怎么能够把真实场景转化为AI的核心竞争力。在学术会议上并不仅是滴滴的核心竞争力,而是整个自动驾驶行业场景怎么变成AI的驱动力。我们有千亿公里的数据,可以说是全球唯一一个有千亿公里数据的自动驾驶公司,一家公司可以从这些千亿数据里发掘高价值的场景,有丰富的覆盖度,对自动驾驶系统进行充分的验证,然后再是路测的验证。每一级相对下一级都是1 000倍的量级,比如千亿公里的数据到仿真测试可能有亿公路,到路测就是百万公里,都是差几个量级的,从而更有效提升自动驾驶的安全性。

这里构建了REALISM解决方案,从桔视车载数据,经过视觉感知,重构出人类司机遇到的场景,然后再把这个场景经过理解放到一个场景库里,比如是换道的场景,还是过斑马线的场景,还是红绿灯的场景,会针对它进行一些仿真测试。经过仿真测试不断演进算法,我们觉得自动驾驶现在感知、预测都变得越来越数据驱动,但其实从决策和控制两个方向上还是偏传统的搜索和优化的方法,完全没有做到数据驱动。比如,如果我给自动驾驶车希望构建一个体系,告诉自动驾驶车对于换道行为给它100万个人类怎么做换道,给100万个好的和不好的驾驶员换道,对于自动驾驶车决策能力的提升是决定性的,才能让自动驾驶车更接近于人类的行为,或接近一个更好的专业驾驶员的行为,接下来再通过一些深度学习,会慢慢超越人类。

基础素材,我们拍到一些人和车、摩托车,中间进行一些感知,把距离和位置都记录下来;然后进行重建,相当于在高精度地图上可以百分之百地重现自动驾驶车所遇到的场景;最后进行仿真的模拟,模拟之后就可以知道自动驾驶车到底能否通过这个场景,能否安全处理这些情形。

桔视在自动驾驶里有五个比较主要的应用。

第一,海量的随机性测试。通过随机性测试,可以更好地验证自动驾驶的安全性。

第二,边缘场景的发掘。可以验证自动驾驶车在1 000个场景里随机都很好,但是怎么能够验证它在百万或千万公里的整个生命周期里都是安全的,所遇到的各种场景都能处理?所以需要边缘场景的发掘,并且针对性地对高频的边缘场景进行开发。比如最近开发的洒水车。一般遇到洒水车要判断是否在洒水、水的速度和车的速度是否一致,整个感知链路都需要调整。现在希望做到数据驱动,相当于见到洒水车标识出来,针对性进行开发,在桔视数据和自动驾驶车数据里去标注很多洒水车的场景,就可以针对性进行开发。

第三,人类驾驶习惯的学习。比如换道行为,我们知道人是怎么换的,可以教自动驾驶车做类似的行为。

第四,在复杂环境里做决策时,需要对周围环境进行预测。比如这些车将来会怎么开,如果有这些数据,预测精度会极大的提高。

第五,地图更新。对于自动驾驶、智慧交通总希望自动驾驶车在高精地图上,并且地图是经过验证、最新的。对于滴滴大数据平台来说,我们每条城市的主干道每天会覆盖几百遍,如果把这些数据用上,就可以对地图进行验证和更新,保证自动驾驶车在遇到地图变化的概率大大降低。因为现在自动驾驶车如果真的遇到地图变化,无非两种情况——减速绕行或停下来。如果能够通过人类驾驶的网约车对这些数据和地图进行更新,会为提高自动驾驶安全性发挥非常大的作用。

滴滴本身的优势

我们把驾驶车辆和服务网络相结合,从品类上来讲有出租车、快车、专车、自动驾驶车,非常无缝的衔接。我们现在在推广混合派单模式,比如同样通过滴滴APP打车,在上海嘉定区有可能派一辆自动驾驶车来接你,但ODD运行范围和区域有限,所以需要在比较好的天气条件下,都在政府所允许服务区内才会派这辆车给你。这些对用户来说是无缝的,不需要单独下载自动驾驶的APP,直接用滴滴APP,因为出行服务不管是自动驾驶车提供给你,还是人类司机提供给你,都是无缝的衔接。

人工智能怎么能更安全

第一,安全测试。作为一个自动驾驶系统,任何AI系统,包括工厂自动化,只要落地,在工厂里要涉及到安全性,就需要有一个测试的周期。对自动驾驶来说测试非常重要,现在每辆自动驾驶车里,虽然目标是无人,但还是派了两个人,一个人操作车辆,一个人监控车的软件、硬件问题,以及记录问题,经过非常严格的流程,大概测试驾驶员通过率是0.5%,相当于从简历到通过我们的培训是0.5%,才能够测试一个自动驾驶系统。因为他不是一个简简单单的驾驶员职位,是一个像飞机试飞员一样,要测试飞机的性能和极限。   

第二,技术可靠。我们和汽车行业一起构建了多层冗余的软硬件架构,基于深度学习和概率论的,99.95%都处理得比人好,AI今天确实有不可解析性;我们又构建了两层,其中一层是冗余的fallback系统,相当于你的AI不管是硬件、软件,出现功能性和硬件性故障时,它有不同层的兜底系统来保证技术上是更安全的。   

第三,验证充分。兰德公司有一个报告,说怎么验证一个自动驾驶系统能够和人一样安全,需要自动驾驶系统在这个环境里驾驶14亿公里。这是什么概念?我们大概算了一下,如果100辆车,每天开24小时,也需要开几十年时间。通过传统的方式去验证一个AI系统非常难,而且所需要的工作量几乎不可能,且系统也只能验证和人一样安全,改一行代码又要重新验证。所以我们需要非常充分的大数据、数据库、场景库来更有效地对自动驾驶系统进行验证。

第四,安全合规。验证过程中我们也在推一些行业的标准,如功能安全的标准和一些ISO的标准、预期功能的标准,希望这些标准能够给自动驾驶的安全落地提供一些保证,或General AI的安全落地提供一些保证;也就是要经过什么样的测试,这些测试要怎么设计的,从科学上达到安全知信度是多少,然后变成国标,这样用户使用自动驾驶系统也更放心。

滴滴自动驾驶在上海有一个示范化的应用落地(嘉定区),希望在南京和其他区域、政府紧密配合,能够把这个服务开放给市民。在上海现在已经有超过3万人报名人数,大家如果去上海,可以打开滴滴APP看看能否叫到自动驾驶车。

(本报告根据速记整理)

CAAI原创 丨 作者韦峻青
未经授权严禁转载及翻译
如需转载合作请向学会或本人申请
转发请注明转自中国人工智能学会