合成孔徑雷達(Synthetic Aperture Radar, SAR)是一種能夠全天時、全天候工作的二維高分辨率成像雷達,具有穿透云霧對地觀測的能力,是國家安全戰(zhàn)略高技術之一。
近日,復旦大學電磁波信息科學教育部重點實驗室徐豐教授研究深度卷積算法在SAR圖像目標識別與地物分類中的應用,取得突破進展,他從SAR圖像中自動學習特征,利用學習到的特征進行目標檢測與目標分類,將深度卷積網(wǎng)絡應用于SAR目標分類基準數(shù)據(jù)集MSTAR上,取得了99%的識別率,將該算法應用于全極化SAR圖像地物分類,也取得了98%的分類精度。
率先將深度學習應用于雷達圖像解譯
徐豐說, SAR非常適用于目標的偵察、監(jiān)視和識別,同時也已經被廣泛應用于地球科學、氣候變化研究、環(huán)境和地球系統(tǒng)監(jiān)測、海洋資源利用、行星探測、戰(zhàn)場感知偵察等領域,具有極高的民用價值和軍用價值。由于散射成像機理以及相干斑噪聲的存在,SAR圖像的解譯比視覺圖像困難得多。近年來,SAR分辨率越來越高,傳感器模式增多,工作波段和極化方式等越來越多元化,使得SAR圖像中信息爆炸性增長,人工判讀的工作量超出了人工迅速做出判斷的極限,人工判讀帶來的主觀和理解上的錯誤就難以避免。因此,SAR圖像數(shù)據(jù)自動分析解譯技術的研究顯得尤為重要。
近年來,深度學習在人工智能的各個領域取得了很好的應用,比如,圖像分類,目標檢測,自然語言處理,機器人。常用的深度學習技術包括深度信念網(wǎng)絡(DBN),卷積神經網(wǎng)絡(CNN),回歸神經網(wǎng)絡(RNN),等等。其中,CNN是最常采用的針對圖像數(shù)據(jù)的算法。在計算機視覺領域中,傳統(tǒng)的圖像分類問題分為特征提取與特征分類兩個階段。特征提取依據(jù)統(tǒng)計或者物理特性手動的設計特征從而對不同目標形成較好的表達。但是,這種模式將被自動學習數(shù)據(jù)分層特征的CNN取代。較之傳統(tǒng)的方法,CNN取得了更好的結果,在圖像分類領域已經取得了一系列突破。在2012年ImageNet大規(guī)模視覺挑戰(zhàn)賽(ILSVRC),Krizhevsky等人采用深度卷積網(wǎng)絡取得了15.3%的錯誤率,遠遠超過以往最好的水平。在2014年,Szegedy等人提出了一個包含22層的GoogleNet,將前五項錯誤率降至6.67%。在2015年,He等人提出152層的殘差網(wǎng)絡(ResNet)并取得了3.57%的整體錯誤率,這已經超過了人類平均水平5%的錯誤率。
伴隨CNN在計算機視覺領域的巨大成功,人們不禁想能否將這種強大的技術應用于SAR圖像解譯,如地物分類、參數(shù)反演以及目標檢測識別。徐豐團隊從2013年開始率先進行了深度學習應用于SAR圖像解譯的研究。
創(chuàng)新應用對于10類目標取得99%識別率
伴隨CNN在計算機視覺領域取得了較好結果,徐豐旨在將CNN算法用于SAR圖像解譯。他研究了深度卷積神經網(wǎng)絡在SAR圖像目標識別與全極化SAR地物分類中的應用。將CNN應用MSTAR數(shù)據(jù),對于10類目標取得了平均99.1%的識別準確率。在全極化SAR對地物分類中,他首先將實數(shù)CNN應用于AirSAR數(shù)據(jù)農作物分類,取得了90%以上的準確率。為了進一步利用極化SAR數(shù)據(jù)的相位信息,將實數(shù)CNN推廣至復數(shù)域,提出了復數(shù)深度卷積網(wǎng)絡(CV-CNN)。CV-CNN的神經元信號和連接權值均為復數(shù),其前饋傳播和后向傳播均定義在復數(shù)域。將CV-CNN在數(shù)據(jù)集上進行分類實驗,結果表明,在同等條件下CV-CNN相比傳統(tǒng)CNN取得更高的分類正確率,農作物分類準確率達到了98%。這幾項成果將發(fā)表在國際電氣與電子工程師協(xié)會地球科學與遙感匯刊上。
在目標分類研究中,為了解決訓練樣本少導致過擬合和泛化能力弱的問題,徐豐通過用卷積層取代全連接層,而不是大量地減少網(wǎng)絡的層數(shù),來減少需要訓練的參數(shù)。這一改變大大減小了過擬合,由于網(wǎng)絡深度不變從而保證了其表征能力不受太大影響。徐豐采用的實驗數(shù)據(jù)是由Sandia國家實驗室(SNL)的SAR傳感器采集的。數(shù)據(jù)的采集是由美國國防部先進研究項目局(DARPA)和空軍研究實驗室(AFRL)共同資助的,作為運動和靜止目標獲取與識別(MSTAR)項目的一部分。該項目采集了幾十萬張包含地面軍事目標的SAR圖像,其中包括不同的目標類型、方位角、俯仰角、炮筒轉向、外型配置變化和型號變種。在標準操作條件下,徐豐測試算法對于10類目標分類的結果。
針對SAR圖像中相位信息,徐豐提出的復數(shù)卷積神經網(wǎng)絡(CV-CNN),不僅將復數(shù)數(shù)據(jù)作為輸入,同時對各層傳遞了相位信息。使用復數(shù)數(shù)據(jù)構建SAR圖像的分層特征。CV-CNN將實數(shù)卷積網(wǎng)絡的網(wǎng)絡結構以及參數(shù)延伸至復數(shù)域,意味著所有的數(shù)學操作也擴展至復數(shù)分析,文章給出了詳細的后向傳播推導。實驗表明CV-CNN的性能遠高于傳統(tǒng)的實數(shù)神經網(wǎng)絡。
最近,針對神經網(wǎng)絡無法對未經過訓練的目標進行分類識別的局限性,徐豐又采用深度生成神經網(wǎng)絡對SAR數(shù)據(jù)集進行自動表征建模,通過表征學習自動建立SAR目標本征特征空間,該本征特征空間由已知目標支撐。此外,通過訓練一個逆向CNN將SAR圖像映射到本征特征空間中,由此建立一個準無監(jiān)督SAR目標識別器,任意一個新目標SAR圖像輸入到該識別器中即可以得到該新目標在本征特征空間中的分布,并由此解讀目標的物理特征。該成果已接收在2017年國際地球科學與遙感年會。
{{item.content}}