原标题:让AI自动调参,才是百度无人车的进化方式:适应环境全靠自己 | 论文

图片 1

车栗子 发自 凹非寺

百度、滴滴、小马智行、文远知行、纽劢科技、图森未来、地平线齐聚CVPR
2019。



2019年计算机视觉和模式识别大会已经落幕。毫无意外,自动驾驶依旧是此届
CVPR 会议议题及参展亮相的焦点。

图片 2

除拥有主场之利的自动驾驶企业,例如Waymo、福特 Argo
AI、Velodyne外,国内自动驾驶玩家纷纷携最新技术走向国际视野:百度、滴滴等老面孔悉数亮相;小马智行、文远知行、纽劢科技、图森未来、地平线也参展CVPR
2019。



一个很明显的趋势是,“开放”成为 CVPR 2019 自动驾驶的关键词。本届 CVPR
大会上,Waymo 和 Argo.AI
都站上了开放数据集的潮头。这是继百度、安波福之后,又两个走向开放的自动驾驶资深玩家。

自动驾驶汽车,需要应对各式各样的路况,工作环境是每时每刻在变化的。

自动驾驶走向开放

所以,训练好L4级的自动驾驶系统并不简单。需要依赖奖励函数(Reward
Function) 和代价函数(Cost Function) 。

在CVPR 2019上,Waymo和Argo AI两家公司都走上了“数据开放”的大道。

如此一来,研究人员需要花大量精力,给强化学习里的这些函数调参环境越复杂,调参的工作就越难做。

此次Waymo公布的数据集包含了3000段平均时长为20秒的驾驶记录,整个数据集包含六十万帧数据,约2500万3D边界框、2200万2D边界框,以及多样化的自动驾驶场景。数据公开之后,Waymo自动驾驶车辆的传感器特点也将一览无余。



图片 3

图片 4

*Waymo公开自动驾驶数据集



Waymo称其数据集包含了3000个场景,是安波福开放的数据集 NuScenes
的3倍,摄像头和激光雷达之间的信息同步也更好。Waymo还提供了5个激光雷达传感器的数据,而NuScenes数据集中只有1个。

不过,百度自动驾驶部门的人类,想要解放双手,将调参重任托付给AI自己。

福特自动驾驶开发合作伙伴Argo
AI的Argoverse数据集与Waymo略有不同。虽然它也包含激光雷达和摄像头数据,但它只覆盖了在迈阿密和匹兹堡记录的113个场景,包括Argo
AI使用的所有9个摄像头以及2个激光雷达传感器的图像,其中标注的目标超过10000个。

于是,他们开发了自动调参方法,让AI能够用更短的训练时间,获得应对复杂驾驶场景的能力。

图片 5

划重点:快速适应多种环境

*Argo 的数据集注重传感器与地图数据的结合

离线调参更安全

Argo
AI的Argoverse数据集的特别之处在于,它是第一个包含高清地图数据的数据集。Argo
AI目前在其运营区域打造了自己的高清地图。这些数据包含匹兹堡和迈阿密290公里的车道地图,如位置、连接、交通信号、海拔等信息。Argo
AI在其地图解决方案中大力宣传的一个功能即其优化处理的能力:能够精确地知道在哪里寻找交通标志和信号,不必扫描整个场景来寻找。

自动驾驶汽车,需要能应付各种场景的AI系统。

封闭还是开放,这是一个始终萦绕在自动驾驶行业里的问题。继今年 3
月份,安波福先行一步公开传感器数据集后,Waymo和Argo
AI的动作都预示着“开放”成为自动驾驶未来发展趋势。



CVPR中国团

图片 6

百度在此次CVPR
上备受瞩目,因其公开了L4级自动驾驶纯视觉城市道路闭环解决方案–百度Apollo
Lite。



图片 7

这个动作规划系统,是基于百度Appollo自动驾驶框架研发的。

Apollo技术委员会主席王亮针对L4级全自动驾驶(Fully Autonomous
Driving)环境感知技术方案进行了讲解,并公开了环视视觉解决方案百度Apollo
Lite技术细节。雷锋网新智驾了解到,Apollo
Lite能够支持对10路摄像头、200帧/秒数据量的并行处理,单视觉链路最高丢帧率能够控制在5‰以下,可以实现全方位360°实时环境感知,前向障碍物的稳定检测视距达到240米。

系统是数据驱动的,用到的数据包括专家驾驶数据周围环境数据

王亮表示,在传统激光雷达为主、视觉为辅的传统融合策略中,视觉感知自身的问题和缺陷在雷达感知的掩盖下暴露不够充分。通过Apollo
Lite打磨迭代的纯视觉技术正在持续反哺百度坚持的多传感器融合解决方案,提升自动驾驶系统的鲁棒性和安全性。



今年 CVPR 2019
上,滴滴也联合加州大学伯克利分校DeepDrive深度学习自动驾驶产业联盟举办CVPR
2019自动驾驶研讨会,详细介绍了滴滴在自动驾驶领域的探索和实践。

图片 8

研讨会现场,滴滴自动驾驶首席工程师贾兆寅还详细介绍了滴滴近期的自动驾驶测试情况,目前滴滴已拥有超过100人的自动驾驶团队,在中国、美国多地开展测试。在积极开展路测的同时,技术团队也在逐步尝试运用丰富而多样的网约车车载数据训练算法模型。



而谈到自动驾驶的落地,贾兆寅认为滴滴短期比较理的想商业化形式可能是“混合派单”,例如在相对简单的路线派出无人车,在复杂路段派单给司机接驾。混合派单模式即可以推动自动驾驶技术更快成熟落地,也可以保证用户日常的出行体验。

上图可以看出,系统分为离线在线两个部分:

今年上半年,滴滴还相继牵手BDD、图灵奖得主Yoshua
Bengio领衔的蒙特利尔学习算法研究所等顶级研究机构不断探索自动驾驶技术边界。

1.在线模块,负责生成一条最优的运动轨迹,用的是奖励函数

2.离线调参模块,才是用来生成奖励函数代价函数的,且是可以随着环境调整的函数。

这一次
CVPR,国内自动驾驶初创团队纽劢科技、文远知行、小马智行、图森未来、地平线等来自国内明星自动驾驶公司都有自己的展台。

所以,第二部分是重点。要看一组参数好不好,模拟测试路测都不可少
(如下图) 。

图片 9



小马智行联合创始人兼CEO彭军亲临展位现场,携同感知团队在CVPR上展示小马智行自动驾驶技术的最新进展和落地成果。一辆搭载小马智行第三代自动驾驶软硬件解决方案PonyAlpha的车辆也亮相CVPR现场。

图片 10

全栈式自动驾驶方案供应商文远知行、纽劢科技、专注于自动驾驶物流场景的图森未来、专注于边缘AI芯片及解决方案的人工智能企业地平线携自动驾驶产品参展,并将商业化、量产作为2019年的关键词。



雷锋网新智驾了解到,今年3月,图森未来对外发布最新的无人驾驶摄像头感知系统。该感知系统利用索尼的汽车CMOS图像传感器,能让无人车在夜间和低能见度下行驶,与之前的1000米感知技术结合后,可将无人驾驶卡车使用率提高到80%。该感知系统会在2019年第二季度量产,并于第三季度应用在图森未来的无人驾驶卡车上、提供商业化运输服务。

相关文章