我国智能驾驶技术快速发展,自动驾驶技术正处于快速迭代阶段,数据驱动成为其核心技术路径之一。同时,通过构建驾驶行为的“数字孪生体”,可实现对复杂交通环境的虚拟仿真与测试,提升研发效率和安全性。高质量训练数据需求迫切,自动驾驶系统需要大量多样化、高保真的场景数据进行模型训练与验证,但真实世界中长尾场景(如极端天气、突发事故)难以采集。
创新数字孪生建模方法,多模态融合深度学习
采用生成式对抗网络(GAN)构建高保真的驾驶行为数字孪生体,突破传统仿真平台依赖真实数据采样的局限,实现长尾场景的虚拟生成。支持图像、雷达点云、视频、文本等多源异构数据的统一建模与生成,提升自动驾驶模型训练的全面性与适应性。
图1 项目整体
利用数据高度的多样性和广泛性,充分释放数据的多重价值
以公开数据集、车链数据、视频图文信号数据、仿真模拟数据以及第三方平台数据等多个维度的数据为基础训练与验证数据,再辅以自主研发的GAN模型生成高保真虚拟驾驶行为数据,针对现实中难以采集的极端天气、突发事故、夜间驾驶等长尾场景进行主动模拟,有效弥补了真实数据覆盖不足的问题。这些数据不仅构成了项目研发的核心资源,也为后续智能标注、质量评估、闭环优化等关键技术环节提供了坚实支撑。
图2 技术路线
深度融合自主强化学习,服务行业快速发展
采用模块化、平台化、闭环化的顶层设计思路,构建了一个涵盖数据采集—虚拟生成—智能标注—质量评估—模型训练—反馈优化的完整自动驾驶数据闭环体系。围绕自动驾驶领域提供多种高质量数据服务能力,包括虚拟数据生成、智能标注、高质量数据集建设、数据质量评估和标准制定等服务,覆盖城市道路、高速路、极端天气、夜间行车等多种场景,满足不同客户群体的需求,推动数据在多个产业环节的价值释放。
图3 模块化技术路线
构建数据安全,促进和谐发展
从数据标准化管理、数据伦理治理、数据全生命周期管理、数据合规及数据安全运营等方面建立了系统化、规范化的管理体系,确保数据在采集、处理、使用、存储和销毁等各环节的安全可控与合法合规。数据治理体系上结构完整、机制健全、执行有力,可为推动产业数字化转型和数据要素市场化配置改革提供了坚实支撑。



