前沿新闻:自主驾驶领域权威国际比赛夺冠。百度研究院RAL团队继续取得技术突破

admin 2021年06月25日 01:59 4126 0

百度网盘课程

通用入口链接！10000G.课程都有！一起学习吧！

科技、数字和网络新闻都成为公众关注的焦点。目前，互联网、科技和数字与我们的生活密切相关。我们应该为自己收取更多的费用，掌握更多的知识，以便掌握更多的信息，不断提高自己的个人能力。边肖今天整理了一篇关于互联网技术数字化方向的文章，希望大家喜欢。

随着自动驾驶技术在不同场景下的不断落地，作为核心模块之一的目标检测对检测算法的精度和稳定性要求越来越高。近日，在ICRA 2021举办的第四届nuScenes 3D目标检测挑战赛中，来自百度研究院的机器人与自动驾驶实验室(RAL)团队在3D目标检测任务的多项评价指标中获得第一名，并将关键指标nuScenes检测分数(NDS)从上一届的71.4%提高到74.9%，创下了3D目标检测比赛的新纪录。

ICRA2021数字场景3D对象检测挑战官方排名

列表地址：https://www.nuscenes.org/object-detection?外部数据=所有映射数据=所有模式=任何

第四届nuScenes目标检测挑战赛吸引了来自世界各地的众多团队，不仅有百度、华为、滴滴等知名企业，还有奥斯汀的德克萨斯大学、上海交通大学、中国科技大学、哈尔滨工程大学等国内外重点大学。

numscenes[1]本次挑战赛使用的数据集是自动驾驶目标检测领域最受欢迎的公共数据集之一，它集成了各种传感器(如摄像头、激光雷达、雷达等)。)并提供丰富的标注信息，包括2D和3D对象标注、点云分割、高精度地图等。整个数据集包含1000个场景，140万帧图像，39万帧lidar点云数据，23个对象类别，140万个三维注记框，数据规模和难度远远超过之前的自动驾驶数据集KITTI。

百度研究院机器人与自动驾驶实验室(RAL)团队在比赛中提出了多模态、多任务信息融合框架FusionPainting[3]，并结合多模型融合技术，推出了CenterPoint-Fusion的技术方案，将评价的关键指标NDS从上届冠军的71.4%提高到74.9%，全班的平均精度从上届冠军的67.1%再一次凭借其优异的成绩在自主驾驶领域展现了百度的技术实力

中心点-融合算法有什么优势？

激光雷达可以以三维点云的形式直接提供周围场景的深度信息，因此被广泛应用于自动驾驶的感知模块。然而，与图像数据相比，激光点云具有密度稀疏、纹理信息差的缺点，因此在检测任务中物体的分类往往不准确。

点绘制[2]利用摄像机和激光雷达之间的标定参数，将图像的语义信息附加到点云上，然后利用融合后的点云信息检测物体，可以有效提高检测精度。但由于图像分割机的特征图像大小的限制，分割结果对物体边界有模糊效应，当反投影到三维点云上时，物体边界上的点云分类信息会不准确，从而影响最终的检测效果。

基于多模态自适应融合的融合绘画流程图

与二维图像分割相比，它具有目标边界模糊的缺点，但直接在三维点云上分割可以得到清晰的目标边界。为了有效解决边界模糊的问题，百度提出了融合2D图像分割和三维点云分割结果的融合绘画框架[3]。对于每个三维点，通过2D图像分割和三维点云分割获得语义信息。最后，采用自适应注意模块有效融合两种信息。融合后的点云可以作为任意三维物体检测器的输入，最终得到三维物体检测结果。

在此框架的基础上，百度在测试阶段进一步增加了多模型融合、半监督学习、数据增强等技术，充分发挥多模型、多模型的作用，进一步提高了目标检测的效果。

数字场景数据集中的三维对象检测效果示例，其中不同的颜色代表不同类型的对象

百度研究院机器人与自动驾驶实验室在自动驾驶感知和机器人学领域有着丰富的经验，该实验室赢得了nuScenes 3 D目标检测挑战赛

富的技术积累和成果输出，研究成果发表在CVPR、ICCV、ECCV、NeurIPS、AAAI、ICRA 与IROS等顶级国际学术会议和《Science Robotics》，《IEEE T-PAMI》、《IEEE T-IP》、《IEEE T-ITS》、《SAGE IJRR》等顶级期刊上。

　　百度布局自动驾驶以来，不仅在自动驾驶技术和智能驾驶领域市场占据了先发优势，并通过持续深耕，在技术创新和应用落地上也取得了令人瞩目的成就。在自动驾驶这场改变人类轨迹的长跑中，百度还将继续技术创新，做这条道路上坚定的领跑者。

　　参考文献：

　　Caesar, Holger and Bankiti, Varun and Lang, Alex H and Vora, Sourabh and Liong, Venice Erin and Xu, Qiang and Krishnan, Anush and Pan, Yu and Baldan, Giancarlo and Beijbom, Oscar. nuscenes: A multimodal dataset for autonomous driving. Proceedings of the IEEE/CVF conference on computer vision and pattern recognition. 2020: 11621-11631.

　　Vora, Sourabh and Lang, Alex H and Helou, Bassam and Beijbom, Oscar. Pointpainting: Sequential fusion for 3d object detection. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2020: 4604-4612.

　　Shaoqing Xu , Dingfu Zhou, Jin Fang, Junbo Yin, Bin Zhou and Liangjun Zhang. FusionPainting: Multimodal Fusion with Adaptive Attention for 3D Object Detection. Accepted by IEEE International Conference on Intelligent Transportation Systems (ITSC), 2021.

本文地址：http://0561fc.cn/41975.html