曾幾何時,我們還會手拿紙質地圖,折來折去的尋找方向,而如今,數(shù)字地圖已成為大多數(shù)人的選擇。而對于自動駕駛汽車來說,高精度數(shù)字地圖同樣不可或缺。
未來的地圖需要提供的不僅僅是方向:人們希望輕松獲取有關其所處位置的最新視覺信息;希望了解基礎設施是否就位(如自行車道和自行車停放架,以方便地騎車駛向目的地);而且出于安全原因,自動駕駛汽車需要360度全方位了解交通環(huán)境。
位于瑞典的初創(chuàng)公司Mapillary是NVIDIA初創(chuàng)加速計劃的成員,致力于通過計算機視覺技術和社區(qū)協(xié)作來助力開發(fā)高精度的地圖。該公司利用精確到街道級別的攝像頭圖像數(shù)據(jù)來構建可視化的世界環(huán)境,以改進地圖、助力城市規(guī)劃發(fā)展,并為汽車行業(yè)的進步做出貢獻。
利用深度學習處理高精度圖像
從印度卡納塔克邦的300 家悅榕莊酒店的地圖繪制,到迪斯尼樂園3D圖像記錄,Mapillary正在通過一張張圖片將世界拼接在一起。該公司每天會從社區(qū)、非營利組織、公司和政府獲得數(shù)十萬的圖像。
處理如此數(shù)量龐大的數(shù)據(jù)絕非易事。為此,Mapillary的團隊使用一種名為“語義分割“(semantic segmentation)的深度學習技術,將圖像分解為多個語義上有意義的部分,然后對其進行分類。Mapillary的地圖數(shù)據(jù)提取方式包含“標準”和“高清”兩類語義圖像分割類型。
標準分割應用于Mapillary數(shù)據(jù)庫中的每幅圖像,目的是實現(xiàn)成本效益但允許損失一定程度的準確性。高清分割模型僅應用于需要高精確度的選定圖像,但是提高精確度的要求必然意味著運行時間更長且內存需求更高。
Mapillary面臨的挑戰(zhàn)是經(jīng)濟高效地運行高清語義分割,為其客戶提供盡可能詳細的地圖數(shù)據(jù),同時保證始終能夠處理越來越多流入其平臺的圖像。
該公司已經(jīng)使用Amazon EC2 P2上的NVIDIA Tesla GPU加速器來進行生產(chǎn),而將 NVIDIA TITAN Xp GPU用于訓練其算法。最近,Mapillary通過Amazon Web Services EC2 P3實例對在Tesla V100 GPU上運行的TensorRT 3.0進行了基準測試。
結果高清分割的速度提高了27倍,同時內存需求降低了81%;標準分割速度提升了18倍,內存需求降低了74%。
Mapillary計算機視覺主管Yubin Kuang表示:“通過將優(yōu)化的TensorRT與Tesla V100相結合,我們能夠以和之前相同的處理成本,提高語義分割推理期間的圖像分辨率,從而使用語義分割來恢復精致細節(jié)和更小的物體。”
技術改進使Mapillary可以更加經(jīng)濟高效地生成地圖數(shù)據(jù),從而幫助創(chuàng)建更出色、更詳細且更智能的地圖。
NVIDIA初創(chuàng)加速計劃
NVIDIA初創(chuàng)加速計劃涵蓋2,000多家初創(chuàng)公司,Mapillary也是其中一員。虛擬加速器計劃為初創(chuàng)公司提供技術、專業(yè)知識和營銷支持。
{{item.content}}