激光雷達(dá)、計(jì)算機(jī)視覺和雷達(dá)三種技術(shù)都能助力自動(dòng)駕駛,但它們各自有自己的優(yōu)劣,因而把它們組合起來是許多自動(dòng)駕駛公司的做法,那么在各種各樣的組合中,這三種技術(shù)最終誰會(huì)占優(yōu)呢?本文由雷鋒網(wǎng)編譯自博客 Brad Ideas。
最近,一大批新創(chuàng)公司蠢蠢欲動(dòng),它們準(zhǔn)備只靠計(jì)算機(jī)視覺和雷達(dá)就搞定自動(dòng)駕駛。這些公司包括 AutoX 以及 Comma.ai。此外,像特斯拉這樣的大公司也想甩掉激光雷達(dá)的包袱,輕裝上陣搞定自動(dòng)駕駛。
當(dāng)然,特斯拉選擇走這條路是因?yàn)?Elon Musk 打了小算盤:激光雷達(dá)現(xiàn)在價(jià)格較貴,產(chǎn)能也不夠,但 Musk 卻想直接讓現(xiàn)售車輛未來通過軟件升級(jí)實(shí)現(xiàn)全自動(dòng)駕駛。
這些公司信心十足,是因?yàn)樵诮鉀Q計(jì)算機(jī)視覺問題上,機(jī)器學(xué)習(xí)的應(yīng)用,尤其是卷積神經(jīng)網(wǎng)絡(luò)最近有了長(zhǎng)足的進(jìn)步。人工智能,特別是模式匹配和計(jì)算機(jī)視覺技術(shù)突破不斷。
此外,對(duì)新創(chuàng)公司來說,這是個(gè)巨大的賭注。類似谷歌這樣的大公司,都在醉心于激光雷達(dá)的研究,因此它們放松了其他解決方案,而這給新創(chuàng)公司留了巨大的發(fā)展空間。
當(dāng)然,這些公司可能最終一無所有,但一旦成功,就能賺的盆滿缽滿,而風(fēng)投公司最愛投資這類公司。
對(duì)于這三項(xiàng)關(guān)鍵技術(shù),如今的趨勢(shì)已經(jīng)非常明顯:
1. 隨著時(shí)間的推進(jìn),激光雷達(dá)的價(jià)格會(huì)逐漸走低,性能會(huì)逐漸增強(qiáng)。最終,高端版本幾百美元就能搞定,而低端版則更加便宜;
2. 計(jì)算機(jī)視覺技術(shù)會(huì)不斷進(jìn)化,最終可靠性達(dá)到使用要求。同時(shí),與其搭配使用的高性能處理器和電源需要都會(huì)不斷走低;
3. 雷達(dá)的價(jià)格會(huì)降至兩位數(shù)(美元),用于分析雷達(dá)數(shù)據(jù)的軟件也會(huì)越來越聰明。
除此之外,一些新技術(shù)未來的走向也不好預(yù)測(cè),比如遠(yuǎn)程長(zhǎng)波紅外激光雷達(dá)、新型雷達(dá)或能直接把光子當(dāng)無線電波處理的激光雷達(dá)替代品。
當(dāng)然,即使新技術(shù)能按照預(yù)測(cè)的趨勢(shì)發(fā)展,未來的贏家也一定是那些可以把多項(xiàng)技術(shù)相結(jié)合的公司,現(xiàn)在的問題是這些技術(shù)到底怎樣結(jié)合才更有效。
現(xiàn)有的激光雷達(dá)有個(gè)問題,那就是它分辨率有些低,探測(cè)距離不夠遠(yuǎn)且售價(jià)昂貴。當(dāng)然,計(jì)算機(jī)視覺問題也不少,當(dāng)下它還不夠可靠,需要外部照明輔助,而且對(duì)計(jì)算機(jī)能力要求較高(意味著貴)。雷達(dá)的問題也是分辨率較低,甚至還不如激光雷達(dá)。
下面,我們就來介紹幾種有效的技術(shù)結(jié)合方案:
方案一:高端激光雷達(dá)為主,計(jì)算機(jī)視覺為輔
受大多數(shù)團(tuán)隊(duì)青睞的 32 線或 64 線激光雷達(dá)在探測(cè)道路障礙的能力上非常可靠,只要在探測(cè)范圍內(nèi),它們幾乎不可能出錯(cuò)。不過,一旦距離稍遠(yuǎn),它們就很有可能分不清障礙物到底是什么。
如將皮卡錯(cuò)看成普通汽車,將 3 位行人看成 2 位,同時(shí)它也無法識(shí)別面部表情和肢體語(yǔ)言。最重要的是,這家伙是“色盲”,它看不出紅綠燈信號(hào)。
如果有了計(jì)算機(jī)視覺的輔助,情況就不一樣了。激光雷達(dá)可以將障礙物的圖片從背景中“摳”出來,隨后計(jì)算機(jī)視覺很容易就能分清它到底是什么,而且計(jì)算機(jī)視覺無需 100% 可靠,它只負(fù)責(zé)提升最終效果就行。
如果自動(dòng)駕駛汽車只需遵從“不要撞到路上的東西”這樣簡(jiǎn)單的命令,激光雷達(dá)就完全夠用,但這樣的設(shè)定下自動(dòng)駕駛汽車會(huì)頻繁剎車,影響乘坐舒適度。
方案二:低端雷達(dá)+更可靠的計(jì)算機(jī)視覺
眼下,只擁有 4 組掃描線的激光雷達(dá)價(jià)格相對(duì)較低廉。不過,這樣的配置探測(cè)能力一般,對(duì)于位置較高、較低或較小的物體有時(shí)會(huì)無能為力。
因此,現(xiàn)在的問題是,如今計(jì)算機(jī)視覺系統(tǒng)能填補(bǔ)這個(gè)窟窿嗎?答案是不太好解決。畢竟計(jì)算機(jī)視覺系統(tǒng)需要外部照明輔助,燈光打在車輛正前方還好,如果弄個(gè) 360 度照明,就會(huì)讓駕駛員分心,而且還會(huì)影響其他車輛的行車安全,但如果不這樣做,又無法獲得 360 度的完整視野。
有人提出可以用紅外線燈來解決,這樣就不會(huì)讓駕駛員分心了,但這種解決方案也有個(gè)問題,那就是它的熱功率不夠高。
低端激光雷達(dá)確實(shí)能解決一些非常危險(xiǎn)的漏報(bào)問題,但它有可能帶來更多副作用(即錯(cuò)報(bào)導(dǎo)致的無端剎車)。在自動(dòng)駕駛車輛行駛中,漏報(bào)完全不能接受,但錯(cuò)報(bào)如果太多,也會(huì)影響用戶的乘坐體驗(yàn)。
這種方案成本較為低廉,不過需要用到較為先進(jìn)的計(jì)算機(jī)視覺技術(shù),而這種水平的計(jì)算機(jī)視覺現(xiàn)有技術(shù)還無法實(shí)現(xiàn),但想實(shí)現(xiàn)這樣的技術(shù)并不是不可能。
其他方案
特斯拉一直在研究如何用雷達(dá)來協(xié)助車載攝像頭。雷達(dá)探測(cè)車輛前方的移動(dòng)物體很有一手,許多新型號(hào)的產(chǎn)品對(duì)靜止物體探測(cè)效果也不錯(cuò),同時(shí)其分辨率也有提高。借助神經(jīng)網(wǎng)絡(luò)等新技術(shù),車輛就能實(shí)時(shí)分辨周圍物體到底是什么了。
雷達(dá)對(duì)車輛的探測(cè)效果很好,但探測(cè)行人卻很弱。不過,如果將雙目視覺與計(jì)算機(jī)視覺搭配使用,探測(cè)能力就能大幅提高。
當(dāng)然,如果只跑高速公路,只需提高雷達(dá)的探測(cè)距離和對(duì)高速物體的辨識(shí)能力就信,畢竟路上不會(huì)出現(xiàn)行人。
到底誰會(huì)最終獲勝?
無論誰獲勝,未來最終決定自動(dòng)駕駛汽車走向何方的是成本問題,而現(xiàn)在,安全則是第一要?jiǎng)?wù)。只要能比競(jìng)爭(zhēng)對(duì)手更安全,花多少錢都行,降低成本的事以后可以徐徐圖之。這也是大多數(shù)團(tuán)隊(duì)都選擇方案一的原因。
不過,有時(shí)自動(dòng)駕駛團(tuán)隊(duì)和媒體很容易犯一個(gè)錯(cuò)誤,那就是做一個(gè)演示很簡(jiǎn)單,只靠激光雷達(dá)或計(jì)算機(jī)視覺就能順利完成,但要想徹底消除那 1% 的不安全因素,你需要花掉整個(gè)研發(fā)過程 99% 的時(shí)間。
即使如谷歌這樣經(jīng)驗(yàn)豐富,行駛里程無人能力的團(tuán)隊(duì),也不敢肯定的說自己的自動(dòng)駕駛汽車車百分之百安全。也許隨著技術(shù)進(jìn)步,隨便一個(gè)團(tuán)隊(duì)就能讓自動(dòng)駕駛汽車在路上玩?zhèn)€“大撒把”,但要記住,演示行駛并不代表成功。