2017年 6月13日,由泰伯網(wǎng)主辦、主題為“空間大數(shù)據(jù)的崛起”的WGDC2017,在北京國家會議中心盛大開幕。大會由空間信息產(chǎn)業(yè)創(chuàng)新創(chuàng)業(yè)服務(wù)平臺泰伯主辦,秉承不斷引領(lǐng)和促進(jìn)空間信息技術(shù)創(chuàng)新與變革的宗旨,WGDC已走過六個年頭,如今成為全球最具前瞻性的跨界創(chuàng)新風(fēng)向標(biāo)。
13日,由百度地圖、賽文交通網(wǎng)共同協(xié)辦的空間大數(shù)據(jù)+智能交通峰會開幕。峰會上,來自百度地圖的主任架構(gòu)師張紹文發(fā)表了以“人工智能如何改變導(dǎo)航”為題的精彩演講。
以下為演講實錄(未經(jīng)本人核實):
張紹文:大家好。我今天講的題目是人工智能如何改變導(dǎo)航。這里面先說一下一個原因,為什么需要用人工智能去改造導(dǎo)航?這里有一個背景,上面提到的一個原因,大家應(yīng)該能感受到,在近幾其實城市的擁堵是在加劇。我最近看到一份報道,2011年的時候北京的擁堵時長3.5小時,2016年統(tǒng)計了一下6.5小時,5年的時間擁堵增加了一倍。
其實這可能不只在北京,剛剛看到Top10,北京還不是最擁堵的,還有很多城市比北京還擁堵,當(dāng)擁堵的發(fā)生越來越加劇,我們在城市生活感受到,其實生活的節(jié)奏也不斷的加速,大家普遍的感受到時間不夠用,一個是交通成本上升,一個是需要更多的時間,這反過來對導(dǎo)航提出了一個新的要求。
傳統(tǒng)的導(dǎo)航其實之前的一個問題,我們要去一個陌生地,這個陌生地怎么走?怎么去?你把我導(dǎo)到就可以了?,F(xiàn)在來講,比如說我們從后臺看到大量的需求發(fā)現(xiàn),其實用戶逐漸從陌生地轉(zhuǎn)換到熟悉用地,上班,回家,其實你知道地點在哪里,但是為什么還需要導(dǎo)航呢?需要路線呢?很多時候用的需求更多的是圍繞到一個我怎么去避堵,怎么去節(jié)省時間,怎么去做好自己的出行安排。
所以,我們覺得新一代導(dǎo)航其實是要智能導(dǎo)航提升我們這塊的需求。我們分解一下智能導(dǎo)航大概分為幾部分,我們認(rèn)為要解決幾部分的需求,一部分是行前部分,一部分是行中部分,行前部分分為兩部分,一個是出行的安排,很多時候比如說,我這個時候要出發(fā)了,其實也許我該走那條路,還依舊是那條路,但是你可能需要看一下具體的時間,好決定后面到達(dá)目的地之后相應(yīng)的安排,這是一個。
還有一種需求比如明天去趕飛機(jī),去機(jī)場,我大概什么時候出發(fā)比較合適到達(dá),所以這是出行安排的一部分需求。第二部分此時此刻我已經(jīng)要出發(fā)了,有哪一條路更適合我此時的需要和場景?你也許是要一條更穩(wěn)妥的路,也許是一條你開起來舒服,沒有那么多擁堵,比較暢快,舒服就行了。這個過程中路線決策是很復(fù)雜的。這是一方面,對我們提出要求,我們需要給出足夠多的路線以及足夠多的路線決策信息,甚至能符合用戶個性化方面的需要。
即使我此時此刻我選擇了一條最合適,最優(yōu)的道路,但是其實大家知道,這整個交通是瞬息變化的,隨時都可能出現(xiàn)一些不可預(yù)測的事件發(fā)生,在這個過程中用戶的需求又分為幾塊,一部分是說,如果發(fā)生一些不可預(yù)測事件,比如說是出現(xiàn)一些異常擁堵,交通事件,能不能給我實時的提醒過,給我一些避堵的路線推薦,這是一方面。
第二個在導(dǎo)航的各方面,其實整個出行成本很高,我們希望從人性化給我引導(dǎo),使得我不要錯過路口,也不需要有很重的駕駛負(fù)擔(dān),這是行中部分。
整體來講,我們是這么去看待智能導(dǎo)航要去做的事情,為了加深大家感性的認(rèn)識,我們先一個我們的視頻,這里會介紹一下我們產(chǎn)品的理念和想法。我們看完這個視頻之后,后面我們介紹一下技術(shù)上我們怎么做到這一點的,選其中一部分。
(播放視頻)
我們認(rèn)為一個優(yōu)秀的導(dǎo)航,需要這三個基礎(chǔ)部分,從用戶輸入,到用戶大概去哪個地方,這樣減少用戶的出行成本,即使確定了一個終點,其實我并不是導(dǎo)到終點旁邊就可以了,更多的是導(dǎo)到他實際的目的地,比如說大門或者停車場。第三部分,我們整個定位,你本身你對你自己現(xiàn)在所處哪個位置,哪條路,這是一部分。精確的,精準(zhǔn)的確定你的起點和終點的目的地之后,我們這個過程的路線給一個最適合你的需要,你個人需要的路線。并且在開車的過程中如果有異常的變化的時候我們實時推薦你一個更好的路線。在行進(jìn)的過程中誘導(dǎo)并不是機(jī)械的,需要結(jié)合用戶實際需要,和開車的時速情況給你更好的指導(dǎo)和指引。整個的過程中其實都是考慮到了用戶很細(xì)致的層面,這個層面很難用一個簡單的規(guī)則或者簡單的一些數(shù)據(jù)測繪就可以解決這一部分問題。很多時候還得結(jié)合用戶,比如說終點,哪個是用戶需要的,結(jié)合大數(shù)據(jù)再結(jié)合人工智能共同做出這個判斷。
這里每一個部分都有很多的工作開展,今天不一一介紹,主要介紹其中很重要的部分就是路線,我們怎么給出用戶最合理的路線,這是我們今天主要的技術(shù),要給出一條最合適的路線其實可以分為幾部分。其中一部分,當(dāng)然我們需要準(zhǔn)確的路網(wǎng),靜態(tài)的路網(wǎng)信息,知道客觀世界中有哪些路,這些路是怎么樣的客觀的信息狀況,這是最基礎(chǔ)的。
第二部分,其實我們需要知道,實時的交通信息狀況。第三才是結(jié)合用戶大眾用戶的需要和個人的需求給出一個最佳的東西。
要做到這一點其實是很復(fù)雜的事情。我們之前一直認(rèn)為我們是不是能構(gòu)建一個數(shù)學(xué)模型,這個數(shù)學(xué)模型就能給出一個精確計算出哪一條路是最優(yōu)秀的,給出這個答案來。
其實探索了一段時間這條路很難。反過來我們后來反過來思考其實我們發(fā)現(xiàn)像老司機(jī),其實很大情況下在本地的車子駕駛過程中他已經(jīng)很能準(zhǔn)確的給出很好的路線,他們是怎么做到這一點的?我們總結(jié)了一下,他具備兩個能力,第一個能力是他們把握交通信息,實時交通信息的能力。比如說你前面有實時路況的時候,他是聽電臺或者自己平時開車路面的感受,能感受到今天大概的交通狀況,哪個地方可能堵,哪個地方?jīng)]堵,也許今天應(yīng)該怎么走。
第二個方面,他有本地豐富的駕駛經(jīng)驗,車開的多了,自然知道一個地方到另一個地方哪些路比較好走,再結(jié)合實際路況做綜合的判斷。我們從老司機(jī)的經(jīng)驗中得出啟發(fā)。我們整個的系統(tǒng)也是圍繞,從這個方式拆借,第一部分,我們覺得,回過來看,我們司機(jī)既然是,只要開的多,他企事業(yè)沒有特別高的智慧才能做到這一點。他其實只是開的多了,有經(jīng)驗了,有豐富的本地經(jīng)驗,他能做到這一點。其實對于一個百度地圖這樣一個產(chǎn)品來講,它其實搜集到了足夠多的用戶數(shù)據(jù),我們能不能把這些經(jīng)驗的數(shù)據(jù),這些軌跡給湊起來,共同去做到這一點呢?其實如果能做到這一點的話,理論上比任何一個老司機(jī)都優(yōu)秀,沒有一個老司機(jī)能開出這么大的里程數(shù)來。所以這就是目標(biāo),把這個數(shù)據(jù)全面整合起來,我們?yōu)槊恳粋€用戶出行提供交通方案。
第一部分,首先我們剛才說了需要了解實時路況也可以說很簡單,但是也可以說很復(fù)雜。簡單來說我們只需要有用戶實際的交通軌跡,我們搜集到用戶足夠多的交通軌跡,通過交通軌跡的時速大致判斷這個地方擁堵,這個地方暢通。細(xì)化到每一個細(xì)節(jié)很復(fù)雜,每個地方有自己的快速,每個地方有自己的慢速,是不是快速就是暢通,慢速就是擁堵呢?這個慢可能剛好從停車場出來,開的比較慢,其實周邊一輛車沒有,這個慢可能是他臨時在那邊停車,辦一個事情,正在等一個人。這里快也許他做了一個違規(guī)的操作,走了應(yīng)急車道。這里可能真的是慢,有很多的軌跡證明這里是慢,這個比較簡單。在這里面,這里慢也許是在等一個紅綠燈,其實車輛也不是很多,但是它在那在等一個紅綠燈。所以顯得速度很慢,這里也一樣,到了公司的時候。
我想表達(dá)一個意思,從時速我們只能知道快慢,知道快慢和擁堵和不擁堵是兩回事情,紅綠燈為例,到底紅綠燈的情況下怎么才是擁堵呢,怎么才是暢通呢?以紅綠燈為例來解讀一下這個問題。我們可以想象一下,比如說我們等一個紅綠燈,那個紅綠燈過了我們可以過了,你等兩個或者三個紅綠燈才能過去的時候你就知道堵了,等一個紅綠燈大概排在哪個位置上,這一次紅綠燈就能過去。所以這個實際上是通過路線的測繪無法給出這樣的信息,因為紅綠燈經(jīng)常是有時候要調(diào)整。所以我們通過大數(shù)據(jù)分析,通過大量的軌跡分析我們清晰的知道,基本上通過一個模型套路基本上知道,實際這個紅綠燈往往在這么一個城區(qū)的情況下就能通過。所以通過大數(shù)據(jù)分析出求出一個紅綠燈的長度,有了紅綠燈的長度,我們進(jìn)而知道我們的軌跡行進(jìn)的狀況,就能分析出實際在這個路口是不是發(fā)生擁堵。
除了這部分,還有一部分通過影像,如果這個地方有攝象頭,我們通過攝象頭做分析,大概知道車停在哪兒,這樣也能輔助幫助我們判斷,這是輔助手段,因為這個信息沒有軌跡數(shù)據(jù)來的更全面。
所以這兩個綜合起來的話,就能給出我們一個實時路況,更準(zhǔn)確的實時路況。
但是實時路況只是我們第一步,因為你求的實時路況并不能給出最優(yōu)的路線,我們更多的是需要給出我們能感知未來的路況。比如說出發(fā),走到上帝為例,西三旗比較堵,西二旗比較堵,如果實時出發(fā)半個小時到哪里就堵了,我們就要預(yù)測。怎么預(yù)測呢?從人類的思維經(jīng)驗來看基本上說,我們大概知道,今天星期三,現(xiàn)在如果預(yù)測的地方,大概下午6點,今天天氣怎么樣,有沒有下雨,實時路況怎么樣?如果那個時候已經(jīng)開始堵了,證明今天擁堵提前了,大致這個情況也許我們已經(jīng)能很準(zhǔn)確的,一定程度的準(zhǔn)確感知到那個地方未來會不會發(fā)生擁堵,但是這個還不夠。我們發(fā)現(xiàn)其實我們只是一個單一的維度去看這個路段堵不堵的話準(zhǔn)確率并不高。因為路況是一個相互交錯,相互影響的關(guān)系。比如說我們感覺到以上帝為例,我們公司所在上帝,我們發(fā)現(xiàn)一堵整個上帝的區(qū)域就會相互影響,會形成一個相互關(guān)聯(lián)的擁堵的狀況。不能單獨的看某一個路段的演變狀況。哪些路受影響其實非常復(fù)雜,我們嘗試自己總結(jié)上帝的擁堵規(guī)律,總結(jié)出來的有偏離,他們之間什么關(guān)系,我們很難做到。
這里面最大的關(guān)系,我們怎么刻劃區(qū)域路況以及區(qū)域路況對當(dāng)前未來這個路的影響。但是其中有一個東西還是給我們很大的啟發(fā),就是阿爾法狗,其實它跟我們面臨的問題是類似的,下圍棋很難說清楚這個邏輯在這個局面情況下下哪一步棋是最好的,你可能總結(jié)出規(guī)律來。真正的高手很難給你一個很強(qiáng)的邏輯,遇到這樣怎么下,他很多時候是一個棋感,他感覺下哪一步棋比較準(zhǔn)確。也許我們不應(yīng)該總結(jié)這個區(qū)域中路段與路段之間的相互關(guān)系,這個太難總結(jié)了,就像阿爾法狗一樣,給一個感覺,我感覺今天出一個什么樣的狀況,也許半個小時內(nèi)那段路出現(xiàn)擁堵的概率多高。
我們一樣像阿爾法狗一樣,我們用感知的方式,其實卷積神經(jīng)網(wǎng)是最好的算法,用卷積網(wǎng)絡(luò)刻劃一個區(qū)域它是怎樣的擁堵,去抽象刻劃。這是我們?nèi)L試的一個方式。這樣一個嘗試方式,加上預(yù)測模型,他的準(zhǔn)確率提升很多。當(dāng)然這個地方實際上還有很多大量的工作去做,還是非常初步的階段。因為對一個神經(jīng)網(wǎng)絡(luò)這樣一個情況,它需要大量的數(shù)據(jù),阿爾法狗解決這個問題的辦法是通過增強(qiáng)學(xué)習(xí),這塊也是我們探索過程中,在有限的軌跡怎么創(chuàng)造無限的數(shù)據(jù)出來,進(jìn)而訓(xùn)練這個模型,這個是一個很大的難題,這個不再具體展開來說。
有了這樣的一個路況的預(yù)測,有了實時路況的感知,又有了未來路況的大概率的預(yù)測,這樣的話,就有利于我們?nèi)プ鰰r間的估計。我們基于這樣估計未來,通過給一條具體的路線,大致需要通過多長時間,就可以求算出來。
有了這條路,給任何一條路,他的未來路況是怎么樣的,通過它的時間是怎樣的,這點是第二步,我們只能評判一條路線怎么樣,還不能判斷從一個點到另一個點,有哪條路可以走。以前的,其實只要把它引導(dǎo)到目的地就夠了,現(xiàn)在的導(dǎo)航需要給用戶更多的選擇,基于用戶的各種場景,甚至個性化給出每一個人,千人千面的給出路線來。這個問題非常復(fù)雜,我們拆解一下,從兩個問題,首先能不能說從一個地點的到另一個地點的到底有哪些路可走,我們再去判斷哪些路更適合你,以及你此時的場景。
一個地點到另一個地點有那些路可走,有很多方式求出來,通過傳統(tǒng)的導(dǎo)航,可以給出,但是這個其實是不夠的。因為對于中國的交通,城市交通是非常復(fù)雜的。其實很多時候有很多經(jīng)驗的東西,很多走出來的,其實你也不知道為什么這么走,就想這么走,你這么走就好,通過大數(shù)據(jù)分析出來,我們發(fā)現(xiàn)從南邊豐臺到首都機(jī)場,其實我們?nèi)绻麄鹘y(tǒng)的搜索的方式給出來的路線是有限的,但是實際用戶走出來的路線遠(yuǎn)超過我們的想象,幾十條,上百條。通過這個軌跡我們把 可能的一個地點到另一個地點的路線搜集起來,作為我們后面做挑選好路線的優(yōu)選路線。
有了這個部分之后我們有了原料,我們怎么挑選出最優(yōu)的路線?就像搜索引擎,有一個關(guān)健字,有成千上萬的頁面,哪個頁面是客戶需要的。主要的特征是時間、距離、擁堵,是不是收費,道路的等級,是不是封閉道路,有沒有紅綠燈,這是是主要的,用戶的實際感受是最主要的。
一個更簡單的,我們出行的方式是人為去定義,我就覺得用戶一定會選擇什么樣的路線,什么樣的路線。當(dāng)我們的特征越來越多的時候發(fā)現(xiàn)這個事情很難做到,就是人腦已經(jīng)無法判斷到底哪些路線更合適。這個時候我們使用了用戶的行為數(shù)據(jù),用戶其實在選擇路線的過程中看到我們給出的路線,他往往會選擇,最后判斷哪一條路線去做。
用戶可能選第二條,為什么推薦的第一條路線他不用,選了第二條,背后隱藏了人類的智慧在里面,這種智慧的關(guān)系,其實就是一個非常好的機(jī)器學(xué)習(xí)訓(xùn)練的數(shù)據(jù)。
我們拿到數(shù)據(jù)之后,結(jié)合這些特征排序,先排一次大眾的排序,就是老司機(jī)經(jīng)驗的,用戶都有哪些路線更傾向選,哪些路線不會選,明顯看起來不靠譜的路線就篩掉??看蟊娺x出的路線,給出的路線大家是不一樣的,大家看到都是一樣的路線,實際來講用戶在不的個人的需要和個人的場景下是不一樣的,以一些低端的或者物流的用戶,其實很借意是不是收費,首都機(jī)場開過來到上帝,有兩條路線。這個時候不同的用戶的選擇是不一樣的,也許首都機(jī)場會堵一點,可能多花10分鐘,對很多用戶來講是能接受的,但是對于高端用戶來講不能接受,明顯那條路線時間更短。還有很多用戶,有一些時候你出席一個重視場合的時候其實你可能給的不是時間最短,而且時間最穩(wěn)妥,走六環(huán),我們?nèi)ヒ粋€地方走六環(huán)最穩(wěn)妥,要收費,時間也很長。你走三環(huán)四環(huán),運氣好的時候時間最短,但是一旦堵起來也許你就誤了重要的時刻。所以不同的用戶,不同的場景其實對于路線的需要不一樣。此時此刻我們在大眾的路線規(guī)劃里面還要加一個個人的路線,我們對個人平時使用,篩選路線,使用路線的時候以及平時的路線決策軌跡看到,我們也能挖掘,進(jìn)而去匹配哪條路線是適合你自己的。這是最后一步,我們怎么給用戶挑選一個更合適的路線出來。這樣一個交通我們在五一之后才上線,還有不完善的地方,隨著大家越使用越多,你貢獻(xiàn)的行為越多,我們越了解你,我們的路線就越來越聰明。
所以最后說一句,我們的交通大腦其實智慧來源于每一位用戶,你的用戶過程中在使用你的產(chǎn)品,每次選擇都是你一個態(tài)度,你每次路線行走的軌跡,所反饋出來的時間,跟我們時間的差異也是認(rèn)為我們系統(tǒng)中的一個lost(音),我們都去學(xué)習(xí),我們積聚成億用戶的使用行為,最后我們給出的路線,我們希望未來,我們的智慧高于任何一個用戶,未來我們理想的狀況是這樣的,我們覺得每次出行,用戶真的沒必要自己去做決策,因為你的決策,你所有的信息,你的經(jīng)驗是非常有限的,如同天氣,以前可能大家看天氣,出去開個窗戶看看外面今天天氣怎么樣,大家現(xiàn)在習(xí)慣百度一下,輸入天氣看一下就知道。我們希望未來每次出行,你拿一下地圖,百度一下地圖,看一下今天應(yīng)該怎樣走,時間怎么樣,來決定自己的行程安排,這我們希望通過半年一年達(dá)到的目的。
今天就到這里。
{{item.content}}