星河动漫,桃花社区在线观看

/?導(dǎo)讀?/

作為全球資本市場的風(fēng)口，自動(dòng)駕駛從來都不曾離開舞臺(tái)的中央。

自動(dòng)駕駛主要包括感知、決策和執(zhí)行三個(gè)環(huán)節(jié)。其中，周邊態(tài)勢的感知，作為自動(dòng)駕駛控制系統(tǒng)的輸入，重要性不言而喻。更早以及更加精準(zhǔn)的信息輸入，將幫助自動(dòng)駕駛控制器盡快做出一個(gè)準(zhǔn)確的決策，調(diào)整車輛姿態(tài)來實(shí)現(xiàn)自動(dòng)駕駛功能。

但在汽車自動(dòng)駕駛領(lǐng)域，周邊態(tài)勢感知的技術(shù)路線選擇之爭從來就沒有停歇過。以特斯拉為最知名的代表是純視覺方案的堅(jiān)定擁護(hù)者，至于國內(nèi)很多企業(yè)則是視覺加雷達(dá)融合方案的擁躉。在線控底盤方案已經(jīng)非常成熟且自動(dòng)駕駛軟件平臺(tái)日趨完善的大背景下，對(duì)于周邊態(tài)勢的感知正在成為自動(dòng)駕駛領(lǐng)域中的一個(gè)受到越來越多關(guān)注的分支。

得到全球公認(rèn)的NuScenes數(shù)據(jù)集

NuScenes數(shù)據(jù)集是由現(xiàn)代汽車集團(tuán)和Aptiv資成立的一家無人駕駛公司Motional開發(fā)，該數(shù)據(jù)集在2019年3月開源，填補(bǔ)了彼時(shí)自動(dòng)駕駛汽車行業(yè)尚無大規(guī)模多模態(tài)數(shù)據(jù)集的空白。目前，NuScenes是被全球各大自動(dòng)駕駛領(lǐng)域相關(guān)公司引用最多的數(shù)據(jù)集，其權(quán)威性得到各方的認(rèn)同。

基于NuScenes數(shù)據(jù)集的NuScenes挑戰(zhàn)賽，也已經(jīng)成為檢驗(yàn)感知算法在自動(dòng)駕駛相關(guān)任務(wù)性能的試金石。我們所熟知的全球范圍內(nèi)多家自動(dòng)駕駛領(lǐng)域的知名企業(yè)及知名高校在NuScenes挑戰(zhàn)賽中進(jìn)行了相關(guān)測試結(jié)果的提交，諸如卡內(nèi)基梅隆大學(xué)、加利福尼亞大學(xué)伯克利分校、MIT等。作為自動(dòng)駕駛AI感知算法的一個(gè)重要的比拼舞臺(tái)，大家通過NuScenes挑戰(zhàn)賽這樣一個(gè)“試金石”平臺(tái)，同場競技，來了解自己所處的位置以及競爭對(duì)手的狀態(tài)，進(jìn)而達(dá)到共同促進(jìn)自動(dòng)駕駛感知技術(shù)發(fā)展的目標(biāo)。

3D目標(biāo)檢測任務(wù)是自動(dòng)駕駛感知性能的關(guān)鍵指標(biāo)

在NuScenes數(shù)據(jù)集中，相關(guān)評(píng)測任務(wù)包括了3D 目標(biāo)檢測、3D 目標(biāo)跟蹤、預(yù)測軌跡、激光雷達(dá)分割、全景分割和跟蹤。其中， 3D目標(biāo)檢測任務(wù)是最為重要的一個(gè)評(píng)測指標(biāo)。

和普通的對(duì)于周邊物體感知不同，自動(dòng)駕駛所面臨的是一個(gè)包含時(shí)間軸在內(nèi)的4維坐標(biāo)空間。所以自動(dòng)駕駛感知系統(tǒng)不僅需要判斷周邊物體的遠(yuǎn)近和大小，同時(shí)也還需要判斷這些物體是靜止的還是運(yùn)動(dòng)的，以及他們的運(yùn)動(dòng)方向和速度。這對(duì)于自動(dòng)駕駛軟件算法進(jìn)行下一步路徑的預(yù)判至關(guān)重要。

NuScenes數(shù)據(jù)集的3D目標(biāo)檢測任務(wù)，覆蓋了包括汽車、卡車、公交車、行人等10種我們?cè)谌粘３鲂兄袝?huì)遇到的絕大部分檢測對(duì)象。通過為它們標(biāo)出3D目標(biāo)框，并估計(jì)出相應(yīng)類別的屬性信息和當(dāng)前的速度信息等，NuScenes提出了一個(gè)綜合指標(biāo)NDS　(NuScenes Detection Score, NDS)。這個(gè)指標(biāo)由平均精度(mAP)、平均平移誤差(ATE)、平均尺度誤差(ASE)、平均方向誤差(AOE)、平均速度誤差(AVE)和平均屬性誤差(AAE)綜合計(jì)算得到，成為衡量自動(dòng)駕駛對(duì)于周邊物體識(shí)別的一個(gè)比較客觀公正的評(píng)價(jià)指標(biāo)。

純視覺方案的優(yōu)勢在哪里？

在自動(dòng)駕駛系統(tǒng)中，感知系統(tǒng)的硬件是由一系列的傳感器組成，主要包括攝像頭、超聲波雷達(dá)、毫米波雷達(dá)和激光雷達(dá)等。它們作為自動(dòng)駕駛系統(tǒng)的“眼睛”，構(gòu)成了整個(gè)自動(dòng)駕駛系統(tǒng)的輸入，其中最核心的就是攝像頭和激光雷達(dá)。

當(dāng)前，在自動(dòng)駕駛領(lǐng)域，感知系統(tǒng)的技術(shù)路線選擇的爭議從來沒有平息過。作為全球知名的車企，特斯拉一直是純視覺方案堅(jiān)定的支持者。而國內(nèi)不少整車企業(yè)，目前都采用了采用雷達(dá)加攝像頭的融合方案來實(shí)現(xiàn)3D目標(biāo)任務(wù)檢測。

兩種技術(shù)路線各有優(yōu)劣：

視覺＋雷達(dá)方案的最大優(yōu)勢來源于激光雷達(dá)。激光雷達(dá)采集的點(diǎn)云信息與生俱來就存儲(chǔ)了三維空間信息，因此基于激光點(diǎn)云信息的3D目標(biāo)檢測任務(wù)實(shí)現(xiàn)出來相對(duì)就簡單了許多。但是這套方案也有自己比較明顯的劣勢：

１.較高的成本：激光雷達(dá)較高的成本，始終是阻礙其在車型上商業(yè)化部署的最大制約因素。最早的Velodyne的激光雷達(dá)高達(dá)8萬美元一個(gè)，讓其始終停留在測試車上。而如今雖然固態(tài)激光雷達(dá)成本大幅下降，但依然是整車不可忽視的一個(gè)零部件成本支出。

２.數(shù)據(jù)融合難度不小：攝像頭和雷達(dá)的數(shù)據(jù)結(jié)構(gòu)并不相同，將兩者采集的數(shù)據(jù)進(jìn)行融合，給到自動(dòng)駕駛控制器最為準(zhǔn)確的黃靜信號(hào)輸入，對(duì)數(shù)據(jù)融合算法也是不小的考驗(yàn)。

至于純視覺解決方案，其最大的優(yōu)勢在于較低的成本。特斯拉所使用的單目攝像頭單件成本不過25美元，全車搭載8個(gè)的話，費(fèi)用也只有200美元。對(duì)于需要大規(guī)模商業(yè)化部署的整車，成本從來就不是一個(gè)可以忽略的難題。過高的成本，必然會(huì)阻礙消費(fèi)者的購買意愿，讓相關(guān)的技術(shù)方案只能停留在實(shí)驗(yàn)室階段。另外，純視覺解決方案依托技術(shù)可帶來比較客觀的迭代提升及較大的上升空間。隨著AI技術(shù)的提升，純視覺3D目標(biāo)檢測算法能夠得以優(yōu)化提升。

但視覺方案也有自己的不足，這個(gè)來源于攝像頭自身的缺陷：無論是對(duì)于靜態(tài)的物體還是對(duì)于識(shí)別紋理或者色彩信息較為豐富的物體時(shí)，都會(huì)顯得力不從心。但攝像頭的天生缺陷也可以用來彌補(bǔ)。通過更為強(qiáng)大的AI算法以及更多的實(shí)際道路場景數(shù)據(jù)的積累，能夠幫助純視覺方案在辨識(shí)周邊道路情況時(shí)能夠更加游刃有余。所以當(dāng)AI算法達(dá)到一定的成熟度可以滿足自動(dòng)駕駛對(duì)于周邊環(huán)境態(tài)勢感知的要求之后，純視覺方案就可以被部署在高等級(jí)自動(dòng)駕駛系統(tǒng)上，來為整車企業(yè)提供一個(gè)可以同時(shí)兼顧商業(yè)化部署和周邊態(tài)勢感知要求的技術(shù)方案。

浪潮信息AI算法實(shí)現(xiàn)監(jiān)測精度大幅度提升

今年10月，在最新一期NuScenes所公布的競賽測評(píng)榜單中，浪潮信息憑借DABNeT4D登頂自動(dòng)駕駛數(shù)據(jù)集NuScenes 純視覺3D目標(biāo)檢測任務(wù)榜單，引發(fā)了極大的關(guān)注。

在這次3D目標(biāo)檢測任務(wù)中，浪潮信息的DABNet4D算法的NDS檢測精度達(dá)到了0.624，相比于年初的NDS精度是0.474的BEV3D算法提升了15%。在同一時(shí)期，激光雷達(dá)的NDS精度從年初的0.685提升到0.728，提升約4個(gè)點(diǎn)。通過簡單的數(shù)據(jù)比對(duì)就可以發(fā)現(xiàn)，浪潮信息AI的純視覺檢測精度在數(shù)值上正在大幅迫近激光雷達(dá)，而這背后都是AI算法的功勞。

浪潮信息此次所提交的算法DABNet4D是Depth-awared BEVNet 4D的縮寫，即深度感知的四維鳥瞰圖(bird’s eye view, BEV)神經(jīng)網(wǎng)絡(luò)，其核心本質(zhì)就是鳥瞰圖。

傳統(tǒng)的純視覺方案，是依靠布置在車身的攝像頭來采集信息。然后通過對(duì)于每個(gè)攝像頭數(shù)據(jù)的融合，來實(shí)現(xiàn)對(duì)車輛周邊態(tài)勢的感知。但這種策略最大的一個(gè)弊端在于一旦遇到比較體積較大的卡車時(shí)，會(huì)導(dǎo)致每個(gè)攝像頭只能捕捉到卡車的一部分的情況，以致出現(xiàn)錯(cuò)判和漏檢的情況發(fā)生。這種情況下，浪潮信息AI團(tuán)隊(duì)引入了鳥瞰圖，即通過上帝視角，來把不同水平視角的圖像融合成一個(gè)統(tǒng)一的以自動(dòng)駕駛車輛為中心的俯視視角的特征圖。這樣就可以最清晰和完整地為自動(dòng)駕駛控制器提供車輛周邊的情況。在遇到體積較大的物體時(shí)，3D目標(biāo)檢測以及其他的檢測、分類、分割等視覺感知任務(wù)就能夠非常輕松地完成。

但要獲得上帝視角的鳥瞰圖的構(gòu)建并非一蹴而就。浪潮信息AI團(tuán)隊(duì)早在今年年初就構(gòu)建了一個(gè)基于Transformer架構(gòu)的多視角特征融合模型CBTR、MASTER(Multi-camerA Spatial and Temporal feature ExtractoR，多相機(jī)時(shí)空特征提取器)算法、并在MASTER算法的基礎(chǔ)上進(jìn)一步引入了深度估計(jì)網(wǎng)絡(luò)等等，最終實(shí)現(xiàn)了更為高效穩(wěn)定的BEV（鳥瞰圖）輸出。此外，通過圖像數(shù)據(jù)增強(qiáng)、BEV特征增強(qiáng)和樣本貼圖增強(qiáng)等多尺度的數(shù)據(jù)增強(qiáng)技術(shù)等，提升模型的檢測效果，進(jìn)而持續(xù)助力DABNet4D算法在NuScenes數(shù)據(jù)集中的優(yōu)異表現(xiàn)。

總結(jié)

浪潮此次打榜成功的DABNet4D算法，讓我們看到了感知層的另一個(gè)解決思路方案：通過對(duì)于態(tài)勢感知算法的持續(xù)優(yōu)化，來不斷提升純視覺方案的辨識(shí)精度，為純視覺方案在自動(dòng)駕駛領(lǐng)域的部署蹚出了一條新的道路。

在滾滾向前的自動(dòng)駕駛浪潮中，作為全球領(lǐng)先級(jí)AI算力基礎(chǔ)設(shè)施提供商，浪潮不僅在于利用自己過往在服務(wù)器這樣的硬件領(lǐng)域的優(yōu)勢，持續(xù)強(qiáng)化自己硬件平臺(tái)協(xié)同優(yōu)勢，同時(shí)也正在大力提升自己在AI算法方面的競爭力，通過算法優(yōu)化來提升相關(guān)的效率，雙向賦能，提升橫跨軟硬件的集群優(yōu)勢。從NuScenes榜單技術(shù)的快速迭代來看，我們有理由相信，隨著算力、算法的持續(xù)型突破，自動(dòng)駕駛產(chǎn)業(yè)化落地進(jìn)程也將多一層“騰飛動(dòng)力之源”。而這些，也都是車企所關(guān)注的方向，也是未來車企發(fā)展智能駕駛能力的關(guān)鍵。