柚子快報邀請碼778899分享:自動駕駛相關(guān)的理論基礎(chǔ)
柚子快報邀請碼778899分享:自動駕駛相關(guān)的理論基礎(chǔ)
本文主要參考論文《基于計算機(jī)視覺和深度學(xué)習(xí)的自動駕駛方法研究_白辰甲》,記錄一些理論知識。
自動駕駛定義
自動駕駛是指車輛通過傳感器感知周圍環(huán)境,在沒有人為干預(yù)的情況下,實時改變駕駛行為,完成駕駛?cè)蝿?wù)。
基于計算機(jī)視覺的自動駕駛技術(shù)
基于計算機(jī)視覺的自動駕駛技術(shù)使用視覺傳感器的觀測圖像作為輸入,駕駛動作作為輸出。
現(xiàn)有方法主要分為間接感知型(Mediated Perception)方法、直接 感知型(Direct Perception)方法和端到端控制(End-to-End Control)方法。
間接感知型方法
間接感知型方法是傳統(tǒng)的自動駕駛方法。 間接感知型方法將自動駕駛?cè)蝿?wù)分為目標(biāo)檢測、目標(biāo)跟蹤、場景語義分割、相機(jī)模 型和標(biāo)定、三維重建等多項子任務(wù),分別作為計算機(jī)視覺的標(biāo)準(zhǔn)任務(wù) 進(jìn)行計算,隨后將計算結(jié)果進(jìn)行轉(zhuǎn)換和整合作為決策的輸入。
算法使用目標(biāo)檢測技術(shù)探測與駕駛相關(guān)的目標(biāo),如道路、交通標(biāo)志、信號燈、車、行人等,使用場景語義分割技術(shù)對交通場景進(jìn)行分割,使用標(biāo)定和重建技術(shù)算與障礙物距離等。系統(tǒng)將所有信息進(jìn)行組合,形成無人車環(huán)境的完整表示,決策系統(tǒng)利用這種環(huán)境表示進(jìn)行決策。
間接感知型方法的優(yōu)勢在于模塊化清晰,可以利用計算機(jī)視覺領(lǐng)域內(nèi)多個子任務(wù)的研究成果,設(shè)計和優(yōu)化每個模塊,各模塊之間耦合度低,容易進(jìn)行組合和調(diào)整,在系統(tǒng)出現(xiàn)問題后容易排查故障。但是,這種方法也一定存在缺陷。
首先,計算機(jī)視覺中的各項子任務(wù)均是針對標(biāo)準(zhǔn)數(shù)據(jù)集設(shè)計的,不一定完全適合自動駕駛系統(tǒng)所面臨的道路交通環(huán)境。
其次,系統(tǒng)冗余性和復(fù)雜度較高。系統(tǒng)輸入由多個子模塊組成,輸入維度較高,但系統(tǒng)輸出一般只有角度和速度等變量,輸出維度很低。
高維的輸入最終轉(zhuǎn)化低維輸出,表明冗余性較高,造成了不必要的資源浪費(fèi),導(dǎo)致成本較高。
目標(biāo)檢測
自動駕駛車輛在交通環(huán)境中與其他交通工具和行人共享道路資源,尤其在城市交通中,交通工具種類繁多,行人、寵物等目標(biāo)也經(jīng)常出現(xiàn)。自動駕駛車輛需要檢測這些目標(biāo)的位置并進(jìn)行分類,根據(jù) 目標(biāo)的種類采取相應(yīng)措施。
目標(biāo)跟蹤
自動駕駛中目標(biāo)跟蹤的目的是實時掌握交通環(huán)境中車輛、行人等目標(biāo)的位置、 速度和加速度等信息,并預(yù)測目標(biāo)未來可能的位置,預(yù)測可能發(fā)生的碰撞,這些信 息對于自動駕駛汽車至關(guān)重要。
場景語義分割
場景語義分割是自動駕駛技術(shù)的一個重要分支,其目的是將一幅場景圖像中的每個像素點(diǎn)都?xì)w屬到某個類別中。交通場景中一般將圖像分割成車、行人、道路等,為自動駕駛車輛理解環(huán)境提供了重要參考。該問題的難點(diǎn)在于交通場景較為復(fù)雜且種類繁多。
相機(jī)模型和標(biāo)定
三維重建
自動駕駛中的常見的三維重建技術(shù)主要基于立體視覺。
基于立體視覺的三維重建模仿人眼成像原理,由兩臺前向平行對準(zhǔn)的相機(jī)進(jìn)行成像,從兩幅圖像中尋找匹配點(diǎn)來估計深度信息,從而重建三維環(huán)境。
深度信息在自動駕駛中可以用來探測障礙物距離、探索安全區(qū)域等。
立體視覺系統(tǒng)主要包括圖像獲取、相機(jī)標(biāo)定、特征提取、立體匹配、深度計算、重建等部分。
其中,圖像獲取主要通過雙目立體相機(jī);
相機(jī)標(biāo)定用于計算相機(jī)內(nèi) 參數(shù)、外參數(shù)、畸變系數(shù)等;
特征提取是指提取二維圖像的角點(diǎn)、邊緣、輪廓等特征,要求特征具有明顯的區(qū)分性和獨(dú)立性,在匹配中需要使用提取到的特征;
立體匹配將兩幅圖像的相同像素點(diǎn)進(jìn)行對應(yīng),是立體視覺技術(shù)的關(guān)鍵;
深度計算是指匹配的 2D 圖像中獲取深度信息,主要依據(jù)三角測量原理從視差圖中估計深度,影 響深度計算的因素有標(biāo)定誤差、特征提取精度和匹配精度等;
重建主要目的是恢復(fù)三維場景的表面信息,視差圖中僅包含部分點(diǎn)的視差,因此需要由視差圖插值來進(jìn)行重建。
直接感知型方法(直接學(xué)習(xí)距離)
直接感知型方法首先人工設(shè)計與自動駕駛相關(guān)的關(guān)鍵指標(biāo),學(xué)習(xí)交通環(huán)境的關(guān)鍵指標(biāo),隨后由控制邏輯進(jìn)行控制。
在間接感知型方法的基礎(chǔ)上進(jìn)行了優(yōu)化,直接學(xué)習(xí)與駕駛相關(guān)的關(guān)鍵指標(biāo)。這些關(guān)鍵指標(biāo)需要根據(jù)駕駛環(huán)境進(jìn)行設(shè)計,一般包括與前車的距離、與左側(cè)標(biāo)志線的距離、與右側(cè)標(biāo)志線的距離等。
但是,該方法也存在問題。因為算法直接學(xué)習(xí)距離,因此需要使用帶有目標(biāo)與無人車距離的數(shù)據(jù)集進(jìn)行訓(xùn)練。在真實交通場景中,采集帶有精確距離信息的數(shù)據(jù)集往往需要使用超聲和激光雷達(dá)等設(shè)備,采集成本高。
直接感知型結(jié)構(gòu)的優(yōu)勢在于沒有單獨(dú)設(shè)計各項任務(wù)的檢測模塊,而直接學(xué)習(xí)與當(dāng)前交通環(huán)境相關(guān)的各項指標(biāo),因此在構(gòu)建完整的交通環(huán)境表示的同時擁有較為簡單的系統(tǒng)結(jié)構(gòu)。其缺陷在于,由于需要人工設(shè)計與交通狀況相關(guān)的指標(biāo),因此難以應(yīng)對非結(jié)構(gòu)化的交通場景。
直接感知型結(jié)構(gòu)所需的訓(xùn)練數(shù)據(jù)在真實交通環(huán)境中較難獲取,因為精確的距離測量往往需要超聲和激光雷達(dá)等設(shè)備,采集成本高,所以數(shù)據(jù)采集需要依賴仿真環(huán)境。
端到端控制方法
端到端控制方法也稱表現(xiàn)反射型(Behavior Reflex)方法,該結(jié)構(gòu)不行任務(wù)拆分,直接從圖像中學(xué)習(xí)轉(zhuǎn)向角等決策信息。
基于端到端控制的自動駕駛技術(shù)采取另一種思路,不對系統(tǒng)進(jìn)行任務(wù)劃分,而直接利用監(jiān)督學(xué)習(xí)的方法學(xué)習(xí)駕駛動作。
相關(guān)科技公司
以谷歌(google)、特斯拉(Tesla)、英偉達(dá)(Nvidia)為代表的科技公司;
百度。
柚子快報邀請碼778899分享:自動駕駛相關(guān)的理論基礎(chǔ)
相關(guān)文章
本文內(nèi)容根據(jù)網(wǎng)絡(luò)資料整理,出于傳遞更多信息之目的,不代表金鑰匙跨境贊同其觀點(diǎn)和立場。
轉(zhuǎn)載請注明,如有侵權(quán),聯(lián)系刪除。