高逼真合成數據助力智駕“看得更準、學得更快”

康謀keymotek

2025年5月7日 11:03

一、引言

隨著自動駕駛技術的逐步落地，感知系統對數據的依賴正以前所未有的速度增長。傳統實車采集雖然真實可信，但在效率、安全性、標注精度以及邊緣場景覆蓋方面均存在顯著限制。

合成數據（Synthetic Data）因具備低成本、高可控性、無限擴展性和高精度標簽等優勢，已成為感知算法訓練與驗證的重要數據來源。尤其在多模態、多場景、大規模自動化生成等方面，仿真平臺正成為構建感知數據體系的重要工具。

在感知系統的開發過程中，我們依托仿真平臺生成覆蓋多種場景和傳感器類型的合成數據，用于支持AVM（環視系統）開發，同時也利用合成數據生成符合公開格式標準的數據集，助力算法在真實部署前實現高效迭代與驗證。本文將系統介紹利用合成數據開發的具體應用流程和實踐效果。

二、 AVM系統開發中的仿真驗證應用

環視系統（AVM, Around View Monitor）是自動駕駛和高級輔助駕駛系統（ADAS）中常見的功能模塊，通常由4個或更多廣角魚眼相機構成，通過拼接多個攝像頭圖像生成車輛周圍360°的鳥瞰圖。

自動泊車系統（APA）需要環視圖像提供對車輛周圍環境的精準感知。通過仿真方式模擬魚眼相機布設和 BEV 拼接，可生成多種泊車場景下的高保真圖像，包括地庫、斜列車位、窄通道等復雜工況。相比實車采集，仿真不僅可以批量構造極端和邊緣泊車條件，還能自動提供精確的障礙物位置與車輛姿態標注，大幅加速感知模型的訓練和驗證流程，減少實車調試時間。

傳統 AVM 系統的相機標定依賴人工操作和實車設備，流程繁瑣且精度受限。通過仿真，可控制各攝像頭位置與視角，并生成可重復、可驗證的圖像和標定數據，適用于整車項目開發初期的快速迭代。虛擬標定不僅提高了標定效率，還支持在方案切換、批量測試、相機布局驗證等場景中自動生成對齊標注，降低人力投入，提升系統上線速度。

在實際開發中，AVM對圖像畸變建模、拼接精度、投影映射等有較高要求，傳統方法依賴人工標定與測試，周期長、靈活性差。而基于aiSim的仿真流程，可有效提升開發效率與驗證精度。

通過合成數據仿真平臺，我們借助從環境搭建到數據生成的全流程仿真，成功實現了4個魚眼相機生成AVM合成數據的優化和驗證。

圖1 基于aiSim構建AVM圖像流程

1、標定地圖與仿真環境構建

我們在Unreal Engine環境中快速搭建6米×11米標定區域，使用2×2黑白相間標定板構成特征紋理區域，并精確布設車輛初始位置，確保視野重疊區域滿足投影需求，并通過特定插件將其無縫導入仿真器中。

圖2 基于aiSim插件的Unreal Engine地圖編輯

2、魚眼相機配置與參數設置

設置前、后、左、右四個魚眼相機，分別具備：

（1）高水平FOV（約180°）；

（2）不同俯仰角（前15°、后25°、側向40°）；

（3）安裝位置貼近真實車輛安裝場景（如后視鏡下方）。

我們采用了仿真器內置的OpenCV標準內參建模，輸出圖像同步生成物體的2D/3D邊界框與語義標簽。

圖3 環視OpenCV魚眼相機傳感器配置

3、BEV圖像生成與AVM拼接

利用已知相機內參和標定區域結構，通過OpenCV完成圖像去畸變與投影矩陣求解，逐方向生成BEV視圖（Bird's Eye View）。結合車輛圖層與坐標對齊規則，拼接生成完整的AVM圖像。

支持配置圖像分辨率（如1cm2/像素）與投影視野范圍，確保幾何準確性。

圖4 投影區域及BEV轉化示意圖

4、多場景合成與傳感器布局優化

通過批量仿真腳本，可快速測試不同環境（如夜間、窄巷、地庫）、不同相機布局組合對AVM系統效果的影響。在算法不變的前提下，系統性評估外參配置的優劣，為傳感器部署提供數據支持。

圖5 不同場景下的AVM合成數據

三、合成數據構建多模態數據集

隨著智能駕駛逐步從基礎輔助走向復雜場景下的高階功能，對感知系統的數據需求也在迅速升級。不僅需要覆蓋高速、城區、出入口等典型 NOA 場景，還要求在不同模態之間實現精確對齊，以支撐融合感知模型的訓練與驗證。在這類任務中，仿真生成的合成數據具備可控性強、標簽精準、格式標準的優勢，正在成為算法開發的重要支撐手段。

在智能領航輔助（NOA）場景中，系統需識別高速匝道、變道車輛、道路邊緣等要素，對訓練數據多樣性與標注精度要求極高。通過仿真構建城市快速路、高速公路等多類 NOA 場景，配合光照、天氣、車流密度等變量自動生成圖像與多模態同步數據。這類合成數據可用于訓練檢測、分割、追蹤等模型模塊，特別適合用于填補實車采集難以覆蓋的復雜或高風險場景，增強模型魯棒性。

融合感知模型依賴相機、毫米波雷達、激光雷達等多種傳感器協同輸入，對數據的同步性和一致性要求較高。通過仿真，可以同時生成這三類傳感器的視角數據，并自動對齊時間戳、坐標系和標注信息，輸出包括 3D 邊界框、語義分割、目標速度等在內的完整標簽，且格式兼容 nuScenes 等主流標準。這類數據可用于訓練融合模型識別道路上的異形障礙物，例如夜間難以通過視覺識別的散落雜物，或需要多模態補強感知的邊緣目標。仿真帶來的高度可控性也便于統一測試條件，對模型性能進行定量分析與精細化調優。

在實際項目中，合成數據的價值不僅體現在生成效率和標注精度，更在于其能否與下游算法開發流程無縫銜接。為了實現這一目標，我們將 aiSim 導出的多模態原始數據，通過自研數據處理腳本，轉換為基本符合 nuScenes 標準格式的數據集。

數據構建流程如下：