Nvidia的項(xiàng)目名叫DAVE2,為什么這樣命名?因?yàn)槊绹鴩啦肯冗M(jìn)研究項(xiàng)目局(Defense Advanced Research Projects Agency)有一個(gè)項(xiàng)目名叫DARPA Autonomous Vehicle(DAVE,既DARPA無人駕駛汽車)。雖然神經(jīng)網(wǎng)絡(luò)、自動(dòng)駕駛汽車看起來是一門新發(fā)明的技術(shù),實(shí)際上谷歌的Geoffrey Hinton、Facebook的Yann Lecune、蒙特利爾大學(xué)的Yoshua Bengio在過去20年里一直在攜手研究它,這些技術(shù)是AI的一個(gè)分支。DARPA DAVE項(xiàng)目申請(qǐng)研究神經(jīng)網(wǎng)絡(luò)自動(dòng)駕駛汽車,它的前身是ALVINN項(xiàng)目,這個(gè)項(xiàng)目是Carnegie Mellon 1989年提出的。有一點(diǎn)已經(jīng)改變:由于GPU的發(fā)展,研究變得經(jīng)濟(jì)可行了?! ?/p>

神經(jīng)網(wǎng)絡(luò)、圖像識(shí)別應(yīng)用(比如無人駕駛汽車)最近出現(xiàn)了大爆發(fā),主要原因有兩個(gè)。第一個(gè),手機(jī)上渲染圖像的GPU已經(jīng)很強(qiáng)大,很便宜,將GPU大規(guī)模裝載到板件等級(jí)的超級(jí)電腦上可以很好地解決龐大的并行神經(jīng)網(wǎng)絡(luò)問題,而且它的價(jià)格也足夠便宜,每一名AI研究人員和軟件開發(fā)者都買得起。第二,大型、標(biāo)簽式圖片數(shù)據(jù)集已經(jīng)存在,我們可以用它來訓(xùn)練大型并行神經(jīng)網(wǎng)絡(luò),這些神經(jīng)網(wǎng)絡(luò)用GPU來執(zhí)行,可以看見、感知攝像頭捕捉的物體。
繪制人類駕駛模式
Nvidia團(tuán)隊(duì)訓(xùn)練了一個(gè)卷積神經(jīng)網(wǎng)絡(luò),它可以繪制單個(gè)前置攝像頭捕捉的原始像素,攝像頭跟駕駛命令直接聯(lián)系。Nvidia技術(shù)的突破之處在于:無人駕駛汽車可以自動(dòng)自學(xué),通過觀看人類的駕駛方式自學(xué)。

雖然操作系統(tǒng)使用的是一個(gè)攝像頭和一臺(tái)Drive-PX嵌入式電腦,但是訓(xùn)練系統(tǒng)使用的卻是三個(gè)攝像頭、兩臺(tái)電腦,它們可以抓取3D視頻圖像、轉(zhuǎn)向角度(來自人類駕駛的汽車),這些信息可以訓(xùn)練系統(tǒng)學(xué)會(huì)“看見”和“駕駛”能力。
Nvidia會(huì)監(jiān)視轉(zhuǎn)向角度的變化,將它作為訓(xùn)練信號(hào),然后將人類駕駛模式映射到攝像頭記錄的位圖圖像中去。系統(tǒng)會(huì)利用卷積神經(jīng)網(wǎng)絡(luò)為駕駛處理步驟介定內(nèi)部表征,比如偵測(cè)有用的道路特征——線路、汽車和道路輪廓。
自動(dòng)駕駛汽車會(huì)感知路況、其它汽車及障礙物,開源機(jī)器學(xué)習(xí)系統(tǒng)Torch 7會(huì)對(duì)處理過程進(jìn)行深入學(xué)習(xí),然后用來操縱測(cè)試汽車。實(shí)際訓(xùn)練以每秒10幀的速度進(jìn)行,因?yàn)榧词顾俣冗_(dá)到30幀區(qū)別也不會(huì)太大,學(xué)習(xí)的價(jià)值并不會(huì)提高。測(cè)試車包括一輛2016款林肯MKZ和一輛2013款福特福克斯。
機(jī)器學(xué)習(xí)處理的核心就是用Torch 7構(gòu)建的卷積神經(jīng)網(wǎng)絡(luò)模擬操縱情況。人類駕駛的汽車會(huì)拍攝一些10fps圖像,卷積神經(jīng)網(wǎng)絡(luò)會(huì)下達(dá)操縱命令,對(duì)10fps圖像進(jìn)行模擬響應(yīng),研究人員需要將模擬響應(yīng)和人類轉(zhuǎn)向角度進(jìn)行對(duì)比。一個(gè)是人類轉(zhuǎn)向角度,一個(gè)是卷積神經(jīng)網(wǎng)絡(luò)模擬的操縱命令,它可以教會(huì)系統(tǒng)“看”和“操縱”的能力,研究者需要對(duì)兩者進(jìn)行對(duì)比,分析其中的差異。汽車會(huì)在測(cè)試路線上行駛3小時(shí),總里程相當(dāng)于100英里,行程會(huì)被記錄為視頻,模擬時(shí)使用的測(cè)試數(shù)據(jù)來自于視頻。
公路測(cè)試
當(dāng)卷積神經(jīng)網(wǎng)絡(luò)模擬駕駛表現(xiàn)良好時(shí),就可以在公路上對(duì)測(cè)試車輛進(jìn)行更進(jìn)一步的機(jī)器學(xué)習(xí)和測(cè)試了。公路測(cè)試可以改進(jìn)系統(tǒng),在整個(gè)過程中需要由人類司機(jī)監(jiān)督無人駕駛汽車,當(dāng)系統(tǒng)出錯(cuò)時(shí)及時(shí)介入。每修正一次,結(jié)果就會(huì)輸入到機(jī)器學(xué)習(xí)系統(tǒng),從而改進(jìn)操縱過程的精準(zhǔn)度。在新澤西Turnpike的行駛過程中,前10英里汽車完全自動(dòng)行駛。在早期測(cè)試中,98%的操作是無人駕駛的。
Nvidia證明卷積神經(jīng)網(wǎng)絡(luò)可以學(xué)會(huì)以下任務(wù):道路偵測(cè),非手動(dòng)道路追隨,對(duì)道路及道路標(biāo)識(shí)、語義抽象、路線規(guī)劃、控制進(jìn)行明確的分解和分類。讓汽車在不同天氣、燈光條件、高速公路或者旁路上行駛,獲得內(nèi)部處理過程,形成不到100小時(shí)的訓(xùn)練數(shù)據(jù),然后用Torch 7渲染這些數(shù)據(jù),系統(tǒng)就可以學(xué)會(huì)上述操作。
從報(bào)告看,Nvidia暗示系統(tǒng)還沒有準(zhǔn)備好投入生產(chǎn),它在報(bào)告中寫道:“如果要提高網(wǎng)絡(luò)的穩(wěn)定性、找到好辦法核實(shí)這種穩(wěn)定性,提高網(wǎng)絡(luò)內(nèi)部處理過程的可視化水平,我們還有更多的工作要做。”
如果您對(duì)您所在行業(yè)有很深認(rèn)知,也想在我們的平臺(tái)上說點(diǎn)什么,我們歡迎您來投稿!
{{item.content}}