編者語:后臺回復“入群”,加入「智駕最前沿」微信交流群
現在無圖/輕地圖的智駕方案比較火,主要就是因為依靠高精地圖來為感知兜底的方式成本太高,那么為什么現在大家都齊刷刷地轉向bev/occ+transformer的方案呢?這種方案相比于用SLAM方法實時建立一定時間范圍內的局部語義地圖,再在此地圖上做規劃的方案優勢在哪兒?以SLAM為基礎做局部導航的缺陷在哪兒?
作為SLAM算法方向的研究生來發表一下自己的看法。
首先我認為題主是混淆了一些概念,SLAM主要是解決定位問題,而BEV/Occ+Transforme主要解決感知任務(局部語義地圖),感知是以定位為前提的,只不過這個定位可以不是SLAM定位。
一般SLAM算法的使用方法分為兩步,先建圖,后定位。在機器人應用中,這里第一步建好的地圖 主要有兩個作用,一個作用是用來進行全局的路徑規劃,另外一個作用是進行第二步的定位。
在自動駕駛場景中道路環境經常變化,高精地圖的維護成本較高,因此自駕采用了重感知輕地圖的方案,其中輕地圖并不是無地圖,自駕中全局的路徑規劃問題可以依靠百度地圖等來進行,定位問題可以使用輪速計、IMU、衛星導航組合的方式來替代。然后在這種定位方法的基礎上進行局部語義地圖的創建。
而題主說的為啥不采用SLAM的方式進行局部語義地圖的創建,我的理解是自駕中還是使用了SLAM中幀間位姿估計的方法,只不過沒有采用基于先驗地圖的SLAM定位方法而已,所以這種多傳感器組合定位的方法只是沒有被叫做SLAM定位而已。
此外,雖然自駕中大多采用輕地圖重感知的方案,但是室內機器人像是掃地機器人、人形機器人、倉運機器人等等還是采用的SLAM+局部語義地圖的方法,因為室內機器人要求更高的精度,而且GPS等傳感器在室內也無法使用,所以目前來說SLAM+感知的方案對于室內機器人來說還是主流。
最后,其實我感覺容易讓題主產生疑惑的點更多的在于名稱的叫法上面,只不過搞深度學習的人把定位+局部語義地圖這一塊工作叫做感知任務而已,其實跟SLAM+局部語義地圖的叫法區別不大,局部語義地圖的創建方法可以是一樣的,區別只在于定位上面而已。
這個問題很好,借此澄清幾個概念:
1 無“圖”智駕,也需要有圖,無“圖”其實是偷換概念,因為商業和監管的原因。
2 不管無圖有圖,自動駕駛感知都有出帶語義的OD,這個感知和BEV與否沒關系,和Transformer與否也沒關系。所以題目里,“無圖方案都用xxx”并沒有邏輯,其實是 無圖方案也可以不用xxx,有圖方案也可以用xxx。
3 無圖方案,都會使用SLAM技術建圖。SLAM技術是一個建圖和定位的技術的打包集合。不管有圖無圖,都會使用SLAM技術做融合定位或者叫定位配準。所以,這個提問,連續犯了三個邏輯錯誤。
4 倒數第二問,又來到了 規劃 問題,規劃和SLAM也并沒有什么相關性。所以我也沒看懂這個問題:“為什么用感知xxx,做定位xxx,比規劃xxx好在哪兒”。自動駕駛都有先驗地圖的,不會像掃地機器人先探索一遍才知道怎么走的,除非先撞一圈墻。
5 關于最后一問,大家都會“以SLAM為基礎做局部導航”,這句話等同于“以定位技術為基礎做定位”。
首先第一“無圖”并不是沒有高精地圖,是不要外部提供的高精地圖,內部是需要自建圖;
第二:SLAM建圖可以作為無圖智駕一種方式,叫記憶行車,業內也有就是大疆,小鵬的通勤模式,這種模式是可以只用導航地圖,但是SLAM一次并不能得到全部道路元素與結構,需要跑重復的道路幾次,所以智駕系統會表現出一回生二回熟,一次比一次開的好,但這也就意味著它需要你跑同樣的路線,SLAM建圖是能適用于你經常上下班或者同一路線的通勤模式;
第三:bev/occ + transformer 不是一個方案,SLAM也是可以使用bev生成的道路拓撲自建地圖的,另外有SLAM也并不意味著不需要occ,occ對于沒有激光雷達方案,道路異形障礙物檢測是必須的;
第四個:一定時間范圍內的局部語義地圖,如果簡單依賴視覺bev+occ,是沒有超視距信息的,也能用,但是你要接受它可能變道到匯入車道以及在遮擋時出現一些意想不到的問題,這種模式上限也就是有圖;
首先就是高速場景,基于高精地圖建立的先驗地圖信息更新比較慢,圖商的地圖車造價很高,都是季度更新的,最多是按照月去更新,所以如果在他們建圖歪了一些的話,進行SLAM匹配時結果就會歪,因此這個技術路線就不是很成功的。
BEV可以實時感知周圍前后20m甚至更遠的距離,足夠規劃去使用。
-- END --
聲明:內容源自3D視覺之心,文中觀點僅供分享交流,不代表本公眾號立場,如涉及版權等問題,請您告知,將及時處理!