柚子快報邀請碼778899分享:自動駕駛相關的理論基礎
柚子快報邀請碼778899分享:自動駕駛相關的理論基礎
本文主要參考論文《基于計算機視覺和深度學習的自動駕駛方法研究_白辰甲》,記錄一些理論知識。
自動駕駛定義
自動駕駛是指車輛通過傳感器感知周圍環(huán)境,在沒有人為干預的情況下,實時改變駕駛行為,完成駕駛任務。
基于計算機視覺的自動駕駛技術
基于計算機視覺的自動駕駛技術使用視覺傳感器的觀測圖像作為輸入,駕駛動作作為輸出。
現(xiàn)有方法主要分為間接感知型(Mediated Perception)方法、直接 感知型(Direct Perception)方法和端到端控制(End-to-End Control)方法。
間接感知型方法
間接感知型方法是傳統(tǒng)的自動駕駛方法。 間接感知型方法將自動駕駛任務分為目標檢測、目標跟蹤、場景語義分割、相機模 型和標定、三維重建等多項子任務,分別作為計算機視覺的標準任務 進行計算,隨后將計算結果進行轉換和整合作為決策的輸入。
算法使用目標檢測技術探測與駕駛相關的目標,如道路、交通標志、信號燈、車、行人等,使用場景語義分割技術對交通場景進行分割,使用標定和重建技術算與障礙物距離等。系統(tǒng)將所有信息進行組合,形成無人車環(huán)境的完整表示,決策系統(tǒng)利用這種環(huán)境表示進行決策。
間接感知型方法的優(yōu)勢在于模塊化清晰,可以利用計算機視覺領域內多個子任務的研究成果,設計和優(yōu)化每個模塊,各模塊之間耦合度低,容易進行組合和調整,在系統(tǒng)出現(xiàn)問題后容易排查故障。但是,這種方法也一定存在缺陷。
首先,計算機視覺中的各項子任務均是針對標準數(shù)據(jù)集設計的,不一定完全適合自動駕駛系統(tǒng)所面臨的道路交通環(huán)境。
其次,系統(tǒng)冗余性和復雜度較高。系統(tǒng)輸入由多個子模塊組成,輸入維度較高,但系統(tǒng)輸出一般只有角度和速度等變量,輸出維度很低。
高維的輸入最終轉化低維輸出,表明冗余性較高,造成了不必要的資源浪費,導致成本較高。
目標檢測
自動駕駛車輛在交通環(huán)境中與其他交通工具和行人共享道路資源,尤其在城市交通中,交通工具種類繁多,行人、寵物等目標也經常出現(xiàn)。自動駕駛車輛需要檢測這些目標的位置并進行分類,根據(jù) 目標的種類采取相應措施。
目標跟蹤
自動駕駛中目標跟蹤的目的是實時掌握交通環(huán)境中車輛、行人等目標的位置、 速度和加速度等信息,并預測目標未來可能的位置,預測可能發(fā)生的碰撞,這些信 息對于自動駕駛汽車至關重要。
場景語義分割
場景語義分割是自動駕駛技術的一個重要分支,其目的是將一幅場景圖像中的每個像素點都歸屬到某個類別中。交通場景中一般將圖像分割成車、行人、道路等,為自動駕駛車輛理解環(huán)境提供了重要參考。該問題的難點在于交通場景較為復雜且種類繁多。
相機模型和標定
三維重建
自動駕駛中的常見的三維重建技術主要基于立體視覺。
基于立體視覺的三維重建模仿人眼成像原理,由兩臺前向平行對準的相機進行成像,從兩幅圖像中尋找匹配點來估計深度信息,從而重建三維環(huán)境。
深度信息在自動駕駛中可以用來探測障礙物距離、探索安全區(qū)域等。
立體視覺系統(tǒng)主要包括圖像獲取、相機標定、特征提取、立體匹配、深度計算、重建等部分。
其中,圖像獲取主要通過雙目立體相機;
相機標定用于計算相機內 參數(shù)、外參數(shù)、畸變系數(shù)等;
特征提取是指提取二維圖像的角點、邊緣、輪廓等特征,要求特征具有明顯的區(qū)分性和獨立性,在匹配中需要使用提取到的特征;
立體匹配將兩幅圖像的相同像素點進行對應,是立體視覺技術的關鍵;
深度計算是指匹配的 2D 圖像中獲取深度信息,主要依據(jù)三角測量原理從視差圖中估計深度,影 響深度計算的因素有標定誤差、特征提取精度和匹配精度等;
重建主要目的是恢復三維場景的表面信息,視差圖中僅包含部分點的視差,因此需要由視差圖插值來進行重建。
直接感知型方法(直接學習距離)
直接感知型方法首先人工設計與自動駕駛相關的關鍵指標,學習交通環(huán)境的關鍵指標,隨后由控制邏輯進行控制。
在間接感知型方法的基礎上進行了優(yōu)化,直接學習與駕駛相關的關鍵指標。這些關鍵指標需要根據(jù)駕駛環(huán)境進行設計,一般包括與前車的距離、與左側標志線的距離、與右側標志線的距離等。
但是,該方法也存在問題。因為算法直接學習距離,因此需要使用帶有目標與無人車距離的數(shù)據(jù)集進行訓練。在真實交通場景中,采集帶有精確距離信息的數(shù)據(jù)集往往需要使用超聲和激光雷達等設備,采集成本高。
直接感知型結構的優(yōu)勢在于沒有單獨設計各項任務的檢測模塊,而直接學習與當前交通環(huán)境相關的各項指標,因此在構建完整的交通環(huán)境表示的同時擁有較為簡單的系統(tǒng)結構。其缺陷在于,由于需要人工設計與交通狀況相關的指標,因此難以應對非結構化的交通場景。
直接感知型結構所需的訓練數(shù)據(jù)在真實交通環(huán)境中較難獲取,因為精確的距離測量往往需要超聲和激光雷達等設備,采集成本高,所以數(shù)據(jù)采集需要依賴仿真環(huán)境。
端到端控制方法
端到端控制方法也稱表現(xiàn)反射型(Behavior Reflex)方法,該結構不行任務拆分,直接從圖像中學習轉向角等決策信息。
基于端到端控制的自動駕駛技術采取另一種思路,不對系統(tǒng)進行任務劃分,而直接利用監(jiān)督學習的方法學習駕駛動作。
相關科技公司
以谷歌(google)、特斯拉(Tesla)、英偉達(Nvidia)為代表的科技公司;
百度。
柚子快報邀請碼778899分享:自動駕駛相關的理論基礎
相關文章
本文內容根據(jù)網絡資料整理,出于傳遞更多信息之目的,不代表金鑰匙跨境贊同其觀點和立場。
轉載請注明,如有侵權,聯(lián)系刪除。