加入星計(jì)劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

AI算法加碼純視覺方案,自動(dòng)駕駛會(huì)否迎來新轉(zhuǎn)折?

2022/12/26
1526
閱讀需 12 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

/?導(dǎo)讀?/

作為全球資本市場的風(fēng)口,自動(dòng)駕駛從來都不曾離開舞臺(tái)的中央。

自動(dòng)駕駛主要包括感知、決策和執(zhí)行三個(gè)環(huán)節(jié)。其中,周邊態(tài)勢的感知,作為自動(dòng)駕駛控制系統(tǒng)的輸入,重要性不言而喻。更早以及更加精準(zhǔn)的信息輸入,將幫助自動(dòng)駕駛控制器盡快做出一個(gè)準(zhǔn)確的決策,調(diào)整車輛姿態(tài)來實(shí)現(xiàn)自動(dòng)駕駛功能。

但在汽車自動(dòng)駕駛領(lǐng)域,周邊態(tài)勢感知的技術(shù)路線選擇之爭從來就沒有停歇過。以特斯拉為最知名的代表是純視覺方案的堅(jiān)定擁護(hù)者,至于國內(nèi)很多企業(yè)則是視覺加雷達(dá)融合方案的擁躉。在線控底盤方案已經(jīng)非常成熟且自動(dòng)駕駛軟件平臺(tái)日趨完善的大背景下,對(duì)于周邊態(tài)勢的感知正在成為自動(dòng)駕駛領(lǐng)域中的一個(gè)受到越來越多關(guān)注的分支。

得到全球公認(rèn)的NuScenes數(shù)據(jù)集

NuScenes數(shù)據(jù)集是由現(xiàn)代汽車集團(tuán)和Aptiv資成立的一家無人駕駛公司Motional開發(fā),該數(shù)據(jù)集在2019年3月開源,填補(bǔ)了彼時(shí)自動(dòng)駕駛汽車行業(yè)尚無大規(guī)模多模態(tài)數(shù)據(jù)集的空白。目前,NuScenes是被全球各大自動(dòng)駕駛領(lǐng)域相關(guān)公司引用最多的數(shù)據(jù)集,其權(quán)威性得到各方的認(rèn)同。

基于NuScenes數(shù)據(jù)集的NuScenes挑戰(zhàn)賽,也已經(jīng)成為檢驗(yàn)感知算法在自動(dòng)駕駛相關(guān)任務(wù)性能的試金石。我們所熟知的全球范圍內(nèi)多家自動(dòng)駕駛領(lǐng)域的知名企業(yè)及知名高校在NuScenes挑戰(zhàn)賽中進(jìn)行了相關(guān)測試結(jié)果的提交,諸如卡內(nèi)基梅隆大學(xué)、加利福尼亞大學(xué)伯克利分校、MIT等。作為自動(dòng)駕駛AI感知算法的一個(gè)重要的比拼舞臺(tái),大家通過NuScenes挑戰(zhàn)賽這樣一個(gè)“試金石”平臺(tái),同場競技,來了解自己所處的位置以及競爭對(duì)手的狀態(tài),進(jìn)而達(dá)到共同促進(jìn)自動(dòng)駕駛感知技術(shù)發(fā)展的目標(biāo)。

3D目標(biāo)檢測任務(wù)是自動(dòng)駕駛感知性能的關(guān)鍵指標(biāo)

在NuScenes數(shù)據(jù)集中,相關(guān)評(píng)測任務(wù)包括了3D 目標(biāo)檢測、3D 目標(biāo)跟蹤、預(yù)測軌跡 、激光雷達(dá)分割、全景分割和跟蹤。其中, 3D目標(biāo)檢測任務(wù)是最為重要的一個(gè)評(píng)測指標(biāo)。

和普通的對(duì)于周邊物體感知不同,自動(dòng)駕駛所面臨的是一個(gè)包含時(shí)間軸在內(nèi)的4維坐標(biāo)空間。所以自動(dòng)駕駛感知系統(tǒng)不僅需要判斷周邊物體的遠(yuǎn)近和大小,同時(shí)也還需要判斷這些物體是靜止的還是運(yùn)動(dòng)的,以及他們的運(yùn)動(dòng)方向和速度。這對(duì)于自動(dòng)駕駛軟件算法進(jìn)行下一步路徑的預(yù)判至關(guān)重要。

NuScenes數(shù)據(jù)集的3D目標(biāo)檢測任務(wù),覆蓋了包括汽車、卡車、公交車、行人等10種我們?cè)谌粘3鲂兄袝?huì)遇到的絕大部分檢測對(duì)象。通過為它們標(biāo)出3D目標(biāo)框,并估計(jì)出相應(yīng)類別的屬性信息和當(dāng)前的速度信息等,NuScenes提出了一個(gè)綜合指標(biāo)NDS (NuScenes Detection Score, NDS)。這個(gè)指標(biāo)由平均精度(mAP)、平均平移誤差(ATE)、平均尺度誤差(ASE)、平均方向誤差(AOE)、平均速度誤差(AVE)和平均屬性誤差(AAE)綜合計(jì)算得到,成為衡量自動(dòng)駕駛對(duì)于周邊物體識(shí)別的一個(gè)比較客觀公正的評(píng)價(jià)指標(biāo)。

純視覺方案的優(yōu)勢在哪里?

自動(dòng)駕駛系統(tǒng)中,感知系統(tǒng)的硬件是由一系列的傳感器組成,主要包括攝像頭、超聲波雷達(dá)、毫米波雷達(dá)和激光雷達(dá)等。它們作為自動(dòng)駕駛系統(tǒng)的“眼睛”,構(gòu)成了整個(gè)自動(dòng)駕駛系統(tǒng)的輸入,其中最核心的就是攝像頭和激光雷達(dá)。

當(dāng)前,在自動(dòng)駕駛領(lǐng)域,感知系統(tǒng)的技術(shù)路線選擇的爭議從來沒有平息過。作為全球知名的車企,特斯拉一直是純視覺方案堅(jiān)定的支持者。而國內(nèi)不少整車企業(yè),目前都采用了采用雷達(dá)加攝像頭的融合方案來實(shí)現(xiàn)3D目標(biāo)任務(wù)檢測。

兩種技術(shù)路線各有優(yōu)劣

視覺+雷達(dá)方案的最大優(yōu)勢來源于激光雷達(dá)。激光雷達(dá)采集的點(diǎn)云信息與生俱來就存儲(chǔ)了三維空間信息,因此基于激光點(diǎn)云信息的3D目標(biāo)檢測任務(wù)實(shí)現(xiàn)出來相對(duì)就簡單了許多。但是這套方案也有自己比較明顯的劣勢:

1.較高的成本:激光雷達(dá)較高的成本,始終是阻礙其在車型上商業(yè)化部署的最大制約因素。最早的Velodyne的激光雷達(dá)高達(dá)8萬美元一個(gè),讓其始終停留在測試車上。而如今雖然固態(tài)激光雷達(dá)成本大幅下降,但依然是整車不可忽視的一個(gè)零部件成本支出。

2.數(shù)據(jù)融合難度不小:攝像頭和雷達(dá)的數(shù)據(jù)結(jié)構(gòu)并不相同,將兩者采集的數(shù)據(jù)進(jìn)行融合,給到自動(dòng)駕駛控制器最為準(zhǔn)確的黃靜信號(hào)輸入,對(duì)數(shù)據(jù)融合算法也是不小的考驗(yàn)。

至于純視覺解決方案,其最大的優(yōu)勢在于較低的成本。特斯拉所使用的單目攝像頭單件成本不過25美元,全車搭載8個(gè)的話,費(fèi)用也只有200美元。對(duì)于需要大規(guī)模商業(yè)化部署的整車,成本從來就不是一個(gè)可以忽略的難題。過高的成本,必然會(huì)阻礙消費(fèi)者的購買意愿,讓相關(guān)的技術(shù)方案只能停留在實(shí)驗(yàn)室階段。另外,純視覺解決方案依托技術(shù)可帶來比較客觀的迭代提升及較大的上升空間。隨著AI技術(shù)的提升,純視覺3D目標(biāo)檢測算法能夠得以優(yōu)化提升。

但視覺方案也有自己的不足,這個(gè)來源于攝像頭自身的缺陷:無論是對(duì)于靜態(tài)的物體還是對(duì)于識(shí)別紋理或者色彩信息較為豐富的物體時(shí),都會(huì)顯得力不從心。但攝像頭的天生缺陷也可以用來彌補(bǔ)。通過更為強(qiáng)大的AI算法以及更多的實(shí)際道路場景數(shù)據(jù)的積累,能夠幫助純視覺方案在辨識(shí)周邊道路情況時(shí)能夠更加游刃有余。所以當(dāng)AI算法達(dá)到一定的成熟度可以滿足自動(dòng)駕駛對(duì)于周邊環(huán)境態(tài)勢感知的要求之后,純視覺方案就可以被部署在高等級(jí)自動(dòng)駕駛系統(tǒng)上,來為整車企業(yè)提供一個(gè)可以同時(shí)兼顧商業(yè)化部署和周邊態(tài)勢感知要求的技術(shù)方案。

浪潮信息AI算法實(shí)現(xiàn)監(jiān)測精度大幅度提升

今年10月,在最新一期NuScenes所公布的競賽測評(píng)榜單中,浪潮信息憑借DABNeT4D登頂自動(dòng)駕駛數(shù)據(jù)集NuScenes 純視覺3D目標(biāo)檢測任務(wù)榜單,引發(fā)了極大的關(guān)注。

在這次3D目標(biāo)檢測任務(wù)中,浪潮信息的DABNet4D算法的NDS檢測精度達(dá)到了0.624,相比于年初的NDS精度是0.474的BEV3D算法提升了15%。在同一時(shí)期,激光雷達(dá)的NDS精度從年初的0.685提升到0.728,提升約4個(gè)點(diǎn)。通過簡單的數(shù)據(jù)比對(duì)就可以發(fā)現(xiàn),浪潮信息AI的純視覺檢測精度在數(shù)值上正在大幅迫近激光雷達(dá),而這背后都是AI算法的功勞。

浪潮信息此次所提交的算法DABNet4D是Depth-awared BEVNet 4D的縮寫,即深度感知的四維鳥瞰圖(bird’s eye view, BEV)神經(jīng)網(wǎng)絡(luò),其核心本質(zhì)就是鳥瞰圖。

傳統(tǒng)的純視覺方案,是依靠布置在車身的攝像頭來采集信息。然后通過對(duì)于每個(gè)攝像頭數(shù)據(jù)的融合,來實(shí)現(xiàn)對(duì)車輛周邊態(tài)勢的感知。但這種策略最大的一個(gè)弊端在于一旦遇到比較體積較大的卡車時(shí),會(huì)導(dǎo)致每個(gè)攝像頭只能捕捉到卡車的一部分的情況,以致出現(xiàn)錯(cuò)判和漏檢的情況發(fā)生。這種情況下,浪潮信息AI團(tuán)隊(duì)引入了鳥瞰圖,即通過上帝視角,來把不同水平視角的圖像融合成一個(gè)統(tǒng)一的以自動(dòng)駕駛車輛為中心的俯視視角的特征圖。這樣就可以最清晰和完整地為自動(dòng)駕駛控制器提供車輛周邊的情況。在遇到體積較大的物體時(shí),3D目標(biāo)檢測以及其他的檢測、分類、分割等視覺感知任務(wù)就能夠非常輕松地完成。

但要獲得上帝視角的鳥瞰圖的構(gòu)建并非一蹴而就。浪潮信息AI團(tuán)隊(duì)早在今年年初就構(gòu)建了一個(gè)基于Transformer架構(gòu)的多視角特征融合模型CBTR、MASTER(Multi-camerA Spatial and Temporal feature ExtractoR,多相機(jī)時(shí)空特征提取器)算法、并在MASTER算法的基礎(chǔ)上進(jìn)一步引入了深度估計(jì)網(wǎng)絡(luò)等等,最終實(shí)現(xiàn)了更為高效穩(wěn)定的BEV(鳥瞰圖)輸出。此外,通過圖像數(shù)據(jù)增強(qiáng)、BEV特征增強(qiáng)和樣本貼圖增強(qiáng)等多尺度的數(shù)據(jù)增強(qiáng)技術(shù)等,提升模型的檢測效果,進(jìn)而持續(xù)助力DABNet4D算法在NuScenes數(shù)據(jù)集中的優(yōu)異表現(xiàn)。

總結(jié)

浪潮此次打榜成功的DABNet4D算法,讓我們看到了感知層的另一個(gè)解決思路方案:通過對(duì)于態(tài)勢感知算法的持續(xù)優(yōu)化,來不斷提升純視覺方案的辨識(shí)精度,為純視覺方案在自動(dòng)駕駛領(lǐng)域的部署蹚出了一條新的道路。

在滾滾向前的自動(dòng)駕駛浪潮中,作為全球領(lǐng)先級(jí)AI算力基礎(chǔ)設(shè)施提供商,浪潮不僅在于利用自己過往在服務(wù)器這樣的硬件領(lǐng)域的優(yōu)勢,持續(xù)強(qiáng)化自己硬件平臺(tái)協(xié)同優(yōu)勢,同時(shí)也正在大力提升自己在AI算法方面的競爭力,通過算法優(yōu)化來提升相關(guān)的效率,雙向賦能,提升橫跨軟硬件的集群優(yōu)勢。從NuScenes榜單技術(shù)的快速迭代來看,我們有理由相信,隨著算力、算法的持續(xù)型突破,自動(dòng)駕駛產(chǎn)業(yè)化落地進(jìn)程也將多一層“騰飛動(dòng)力之源”。而這些,也都是車企所關(guān)注的方向,也是未來車企發(fā)展智能駕駛能力的關(guān)鍵。

相關(guān)推薦

電子產(chǎn)業(yè)圖譜