6月14日,在WGDC2018大會上,京東金融集團(tuán)副總裁、首席數(shù)據(jù)科學(xué)家鄭宇就“大數(shù)據(jù)和AI打造智慧城市”的話題進(jìn)行了專題演講,以下為演講實(shí)錄。
鄭宇:
謝謝大會邀請,有機(jī)會跟大家介紹我們最近在城市計(jì)算領(lǐng)域的工作。
什么叫城市計(jì)算呢?就是用大數(shù)據(jù)和人工智能打造未來城市。進(jìn)一步講,我們是通過對數(shù)據(jù)不斷的搜集、管理、分析和挖掘,再利用挖掘出來的知識解決社會痛點(diǎn),包括交通、環(huán)境、能耗、公共安全等等。它是大數(shù)據(jù)、人工智能、云計(jì)算在城市場景的有機(jī)融合。
這個(gè)領(lǐng)域現(xiàn)在美國已經(jīng)有碩士學(xué)位,很多國際會議上也已成為一個(gè)公共的領(lǐng)域。
現(xiàn)在京東在這個(gè)領(lǐng)域里有什么理念,在做什么呢?首先,我們能夠提供點(diǎn)線面結(jié)合的頂層設(shè)計(jì),加上跨多個(gè)領(lǐng)域的垂直應(yīng)用。這個(gè)其實(shí)很困難,現(xiàn)在市面上有很多做點(diǎn)的智慧城市公司,給你解決一個(gè)攝象頭的問題、一個(gè)充電樁的問題,但是這些點(diǎn)之間是不聯(lián)系的,是孤立的,給政府管理帶來一定的困難。但是要做出一個(gè)跨領(lǐng)域的頂層設(shè)計(jì),你必須同時(shí)在各個(gè)行業(yè)里面都有很深的積累,這是面臨的一個(gè)困境。過去十來年我們一直在各個(gè)領(lǐng)域里面摸爬滾打,所以積累了很多環(huán)境、交通、能耗、公共安全等行業(yè)知識,回過頭來再做頂層設(shè)計(jì),這才能落地。
第二,城市在不斷發(fā)展,從規(guī)劃到運(yùn)維、到預(yù)測,而預(yù)測又可以指導(dǎo)未來的規(guī)劃,所以它一定是不斷循環(huán)和迭代的。下面我以給雄安做的智能城市整體規(guī)劃方案為例,給大家介紹這個(gè)理念。
這里面每一個(gè)框框就是點(diǎn)的設(shè)計(jì),比如說你規(guī)劃一個(gè)自行車道,這是一個(gè)點(diǎn)的智慧城市設(shè)計(jì)。但是光規(guī)劃一個(gè)自行車道是不夠的,規(guī)劃完了之后就要進(jìn)行運(yùn)維。怎么把自行車合理的調(diào)度,使得自行車的運(yùn)力最大化,這是運(yùn)維的問題。其次我要預(yù)測未來各個(gè)地方正確的需求,以及未來一年、兩年各個(gè)地方人們對自行車騎行的需求,這個(gè)預(yù)測回過頭來可以指導(dǎo)我們的規(guī)劃。這是一條線,這條線變成閉環(huán),點(diǎn)變成線,很多線再變成面,這就叫點(diǎn)線面結(jié)合。
我們把城市分成三個(gè)階段,從規(guī)劃到運(yùn)維再到預(yù)測階段。每一個(gè)階段里面都有很多板塊,比如規(guī)劃可以包括交通規(guī)劃、用地規(guī)劃、環(huán)境規(guī)劃、安全規(guī)劃等等,整個(gè)三個(gè)階段里面都是用一個(gè)城市計(jì)算平臺貫穿始終。
當(dāng)然平臺很重要。這是我們?yōu)橹悄艹鞘写蛟斓某鞘杏?jì)算平臺,它有三個(gè)特點(diǎn):數(shù)據(jù)標(biāo)準(zhǔn)化、算法模塊化、平臺生態(tài)化。城市數(shù)據(jù)看似千百種,但是按照數(shù)據(jù)格式、數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)的時(shí)空屬性,其實(shí)只有6種數(shù)據(jù)。我們用6種數(shù)據(jù)模型就能夠把整個(gè)城市里面所有數(shù)據(jù)裝進(jìn)去,避免了一種數(shù)據(jù)開發(fā)的模型,變得系統(tǒng)不可控、不可復(fù)制。我們把看似不相同的應(yīng)用背后的公共算法抽象出來,變成算法模塊放在平臺里面,讓我們可用模塊化的設(shè)計(jì)快速搭建垂直應(yīng)用。
我們還會把平臺開放出來。當(dāng)前階段,有些小型企業(yè)有人工智能的需求但缺乏獨(dú)立搭建平臺的能力。此時(shí),他們可以利用我們平臺模塊化的設(shè)計(jì)快速搭建自己的垂直應(yīng)用。
這個(gè)平臺是針對于時(shí)空數(shù)據(jù)的管理平臺和人工智能算法平臺,不是普通的視覺、文本和語音算法平臺。針對時(shí)空數(shù)據(jù)應(yīng)該有特殊的理解和特殊的人工智能算法,這也是我們過去很多年的積累。
現(xiàn)在看看在這個(gè)平臺之上搭建各個(gè)板塊的應(yīng)用,涉及到交通、環(huán)境、能耗、公共安全,每一個(gè)板塊舉一個(gè)實(shí)際的案例來展現(xiàn)我們平臺的威力。
第一個(gè)是跟聯(lián)通改造線下的營業(yè)廳。
聯(lián)通有大量的線下資源,因?yàn)樗麄冇泻芏酄I業(yè)廳,現(xiàn)在隨著很多業(yè)務(wù)在網(wǎng)上可以完成,用戶其實(shí)不需要到營業(yè)廳辦理自己的業(yè)務(wù),所以很多營業(yè)廳的資源開始變得閑置。聯(lián)通希望能夠?qū)δ承I業(yè)廳進(jìn)行改造,在里面提供3C產(chǎn)品的體驗(yàn)和出售,從而把用戶拉回到營業(yè)廳,只要用戶到營業(yè)廳就能帶來業(yè)務(wù)的轉(zhuǎn)化。要實(shí)現(xiàn)這個(gè)目標(biāo),我們就要回答兩個(gè)問題:
第一,把哪些舊的營業(yè)廳進(jìn)行改造,提供3C產(chǎn)品的體驗(yàn)和出售?
第二,到底應(yīng)該根據(jù)哪些地域特點(diǎn)組合這個(gè)3C產(chǎn)品,從而使得用戶興趣最大化?因?yàn)槊總€(gè)地方的興趣不一樣,有的地方喜歡小米手機(jī),有的喜歡Ipad,要回答這個(gè)問題聯(lián)通自己的數(shù)據(jù)是不夠的,他只有運(yùn)營商自己一家的數(shù)據(jù)。這個(gè)時(shí)候結(jié)合京東的數(shù)據(jù),我們可以知道各個(gè)地方人員對3C產(chǎn)品購買的情況,從而合理的選址、合理的配置資源——這既是數(shù)據(jù)的融合,也是一個(gè)商業(yè)模式的融合。
一個(gè)是線上的購買,一個(gè)線下購買,當(dāng)用戶到營業(yè)廳的時(shí)候,其實(shí)很多時(shí)候通過掃碼上線查詢產(chǎn)品體驗(yàn),甚至在線上購買,到最后變成線下和線上無界零售。這是我們通過三種數(shù)據(jù)融合,包括聯(lián)通、京東和第三方數(shù)據(jù),通過人工智能特殊算法選址,并且排序哪些營業(yè)廳可能給我們帶來利潤最大化。我們既考慮用戶服務(wù)的數(shù)量,也要考慮未來各個(gè)營業(yè)廳的收益,這都是以前不存在的算法,這是學(xué)習(xí)排序和最大化的覆蓋算法,都是新興的針對時(shí)空數(shù)據(jù)的人工智能算法。
第二個(gè)例子是跟摩拜合作,做一個(gè)違章停車的檢測。
我們發(fā)現(xiàn)很多馬路邊都會有計(jì)程車停在自行車道上,占道停車。如果有占道停車發(fā)生,我們的騎行線路就不得不改變,彎過來騎到馬路中央。這個(gè)線路通過GPS統(tǒng)計(jì)可以發(fā)現(xiàn)捕捉到,如果發(fā)現(xiàn)大量的此類線路,我們就可以猜到那個(gè)地方有違章停車的現(xiàn)象。用這種方法我們可以自動的感知整個(gè)城市街區(qū)的違章停車情況,從而把有限的警力投放到該投的地方去做管理,來疏解交通、避免擁堵,避免出現(xiàn)交通事故和人身安全。
這就是用人工智能和大數(shù)據(jù)的方法提高政府的管理效率,治理城市的案例。
這個(gè)跟交通相關(guān),紅色的街道通過我們算法自動判斷出來,這個(gè)地方有違章停車,綠色的地方是沒有的。一切東西都是智能的、全自動的,而且不需要裝任何的攝象頭,不需要對整個(gè)城市增加任何傳感器,就可以檢測違章停車。
我們推薦這樣的解決方案:不再給城市增加新的負(fù)擔(dān),好好利用現(xiàn)在城市已有的基礎(chǔ)設(shè)施和數(shù)據(jù)來解決面臨的問題。
下面一個(gè)是我們?yōu)楣舶踩峁┑娜肆髁款A(yù)測。
我們能夠預(yù)測每一個(gè)區(qū)域內(nèi)部未來多少人進(jìn)和出,這個(gè)跟公共安全有極大的關(guān)系。大家應(yīng)該還記得2015年上海的踩踏事件,那就是因?yàn)闆]有提前預(yù)知這個(gè)地方多少人進(jìn)、多少人出,導(dǎo)致管控措施與人流量的級別不對等,從而導(dǎo)致事件發(fā)生。如果我們可以提前預(yù)測這個(gè)地方人的進(jìn)和出,就可以提前管控、提前疏導(dǎo)。
最早時(shí)候我們只能做均勻網(wǎng)格的人流量進(jìn)和出,但是實(shí)際上區(qū)域并不是均勻網(wǎng)格的。區(qū)域是由主要街道和河流構(gòu)成的區(qū)域,就像這樣的區(qū)域,這個(gè)區(qū)域的人流量怎么預(yù)測?會使得以前的算法,比如說視覺算法、CNN算法都會失效,因?yàn)槎际蔷鶆蚓W(wǎng)格的。
針對時(shí)空數(shù)據(jù)特殊的人工智能算法才可以解決這個(gè)問題,進(jìn)一步預(yù)測人流量的轉(zhuǎn)變。從A到B多少人,以前我們只知道A總數(shù)多少人進(jìn)去,總數(shù)多少人出來,并不知道這個(gè)人從哪里來、到哪里去?,F(xiàn)在我們可能知道,比如說這個(gè)會場有20%的人可能從火車站過來,10%來自于清華,這樣在源頭進(jìn)行管控,避免了事故在終點(diǎn)去解決。這里面用了大量的針對時(shí)空數(shù)據(jù)的人工智能算法,而且這個(gè)難度非常大,創(chuàng)新性非常高。
下面這個(gè)案例是救護(hù)車的選址。
我們知道打120求救電話,120會派一輛車把病人送到醫(yī)院,送到醫(yī)院之后這個(gè)車會返回到救護(hù)車的站點(diǎn),救護(hù)車的站點(diǎn)和醫(yī)院并不在同一個(gè)地方,這是兩個(gè)不同的體系。醫(yī)院不能把救護(hù)車全部放在院里,救護(hù)車的站點(diǎn)選址很重要,這是天津市的真實(shí)系統(tǒng)。以前救護(hù)車的站點(diǎn)靠拍腦袋決定,看看這邊多少人,多少路放一個(gè)站點(diǎn)。但是這個(gè)地方對120的真實(shí)需求并不僅僅與人數(shù)相關(guān),還與人的體質(zhì)、生活狀況、交通情況相關(guān)。
現(xiàn)在基于大量120的真實(shí)求救數(shù)據(jù),我們知道什么時(shí)間、什么地方有多少人搶救,以及每一輛救護(hù)車去搶救時(shí)的軌跡數(shù)據(jù)。結(jié)合這兩類數(shù)據(jù),我們對救護(hù)車的站點(diǎn)進(jìn)行重新選址,在不增加任何資源投入的情況下,還是這么多站點(diǎn),但是從站點(diǎn)到病人的搶救時(shí)間縮短了30%。這是人命關(guān)天的事情,這是大數(shù)據(jù)、人工智能算法帶來的價(jià)值。
這是深圳市管網(wǎng)水的測點(diǎn)。我們希望能夠提前預(yù)測哪個(gè)地方的水質(zhì)發(fā)生了變化,根據(jù)預(yù)測可以提早改變出廠設(shè)置,保證水到達(dá)居民飲用站點(diǎn)的時(shí)候水質(zhì)是好的。這個(gè)預(yù)測是很困難的,我們的管道雖然不復(fù)雜,但受很多因素影響。
這里我們用新的人工智能算法對所有測點(diǎn)的水質(zhì)做協(xié)同的預(yù)測,而不是單點(diǎn)預(yù)測。這里面用了很多的數(shù)據(jù),包括氣象、水質(zhì)、地面上的交通流量等情況。大家可能覺得地面上交通流量怎么會影響水質(zhì)?因?yàn)榈孛嫔系慕煌髁亢偷乩硇畔⒎从沉藚^(qū)域的功能,不同的區(qū)域在不同時(shí)間會有不同的用水模式,不同用水模式導(dǎo)致了水質(zhì)的變化。所以很多因素看似不直接相關(guān),其實(shí)相關(guān),這是大數(shù)據(jù)的理念,多元素融合,在我們很多項(xiàng)目都得到大量的體現(xiàn)。
下面這個(gè)是我們跟國家能源局最新合作的項(xiàng)目。
我國的電力行業(yè)里面,火電占70%的比例?;痣娮畲蟮膯栴}是要燒煤,煤是不可再生資源,同時(shí)會產(chǎn)生污染物排放,痛點(diǎn)是怎么用更少的煤發(fā)更多的電,并且產(chǎn)生更少的污染排放。最近我們用人工智能的算法,比阿爾法狗更難、更高級的算法,對整個(gè)鍋爐的發(fā)電工藝進(jìn)行了優(yōu)化,使得我們能夠人工智能的算法動態(tài)的控制鍋爐的開度、送風(fēng)、送水,讓鍋爐用更少的煤發(fā)更多的電,產(chǎn)生更少的污染排放。整個(gè)效率提高0.5,意味著什么?發(fā)電效率提高0.5,意味著推廣到全國2千多臺機(jī)組,全國一年節(jié)約一百個(gè)億。并且這不僅僅是錢的問題,這是環(huán)境保護(hù)的問題,這是人類產(chǎn)業(yè)升級的問題,整個(gè)國家能源行業(yè)發(fā)展的根本問題,這是一個(gè)非常重大的突破。
這也是我們出來做這個(gè)事情的情懷,我們希望我們的技術(shù),能夠讓國家、讓人民的生活變越來越好。
再下來是我們做的信用城市。
信用城市包括三個(gè)部分,包括居民信用、企業(yè)信用和政府的信用。居民信用涉及到我們以后的出行、購物等很多環(huán)節(jié)。我們?yōu)槭裁从么髷?shù)據(jù)和人工智能來做這個(gè)信用體系呢?
第一,人的信用跟產(chǎn)品相關(guān)。我們?nèi)プ庖粋€(gè)自行車和我們買房貸款所考慮的因素是不一樣的,而且在不同的產(chǎn)品里面不同的數(shù)據(jù)帶來的權(quán)重也是不一樣的。
第二,判斷一個(gè)企業(yè)或者一個(gè)人的信用,我們更多希望預(yù)判。如果一個(gè)企業(yè)出了事情可以告訴我,其實(shí)有點(diǎn)太晚。如果能提前知道未來一個(gè)季度,這個(gè)企業(yè)可能存在很高的信用風(fēng)險(xiǎn),我們就可以提前干預(yù),避免出現(xiàn)事故帶來的后處置的管理成本。
第三,信用是需要?jiǎng)討B(tài)更新的。一個(gè)企業(yè)可能今天早晨信用還比較好,到了下午的時(shí)候可能出了問題,我們希望第一時(shí)間能夠反映。
基于這三個(gè)原因,我們以前基于簡單規(guī)則打分制的信用是不合適的。現(xiàn)在我們在福州做了一個(gè)試點(diǎn),提出城市誠實(shí)信用平臺,基于人工智能和大數(shù)據(jù)的方法,結(jié)合政府的數(shù)據(jù)和企業(yè)的數(shù)據(jù),為每個(gè)居民、每個(gè)企業(yè)打造針對不同場景的精準(zhǔn)信用分?jǐn)?shù)?;谶@個(gè)平臺我們還提出來信用地圖,這個(gè)地圖每個(gè)柱子代表一個(gè)企業(yè),柱子的高度反映了企業(yè)的信用風(fēng)險(xiǎn),幫助政府把控這個(gè)地方各個(gè)企業(yè)的潛在風(fēng)險(xiǎn)。
我們在福州市政府和新華社的支持下,打造了這樣一個(gè)信用街區(qū)。在信用街區(qū)里面提供了信用租賃、信用支付、信用商家、信用購物等5個(gè)場景,我們做技術(shù)支持。我們看信用地圖,這里面每個(gè)柱子表示福州市的一個(gè)企業(yè)。我要強(qiáng)調(diào)一點(diǎn),在算企業(yè)的信用分?jǐn)?shù)的時(shí)候,用人工智能的方法決定不同維度的權(quán)重。我們考慮到司法類、經(jīng)營類、企業(yè)經(jīng)營、企業(yè)司法類、企業(yè)創(chuàng)新類等5類數(shù)據(jù),但是這5類數(shù)據(jù)的權(quán)重到底是多少?現(xiàn)在用人工智能可以動態(tài)的決定這個(gè)權(quán)重,誰更好,誰更不好。
所以強(qiáng)調(diào)第一點(diǎn)是基于人工智能的方法來決定區(qū)域的群眾來打分。
第二,我們能夠?qū)Ω鱾€(gè)企業(yè)潛在風(fēng)險(xiǎn)進(jìn)行預(yù)判。2017年9月我們發(fā)現(xiàn)這個(gè)企業(yè)存在潛在風(fēng)險(xiǎn),結(jié)果兩個(gè)月之后,這個(gè)企業(yè)果然出現(xiàn)了重大的經(jīng)營風(fēng)險(xiǎn)。如果能夠提前預(yù)判到就能提前管理、干預(yù),避免出現(xiàn)經(jīng)營風(fēng)險(xiǎn)帶來的損失,這是預(yù)測。
第三,我們發(fā)現(xiàn)某些區(qū)域里面某個(gè)行業(yè)的企業(yè)普遍存在信用問題,原因可能是這個(gè)地方的管理政策或某些策略出了問題。我們能發(fā)現(xiàn)信用背后的根源,這是一些簡單的打分規(guī)則得不到的。
可能大家覺得市面上挺多智慧城市的公司,這里我要強(qiáng)調(diào)一下我們的優(yōu)勢是什么。第一,我們不是做傳統(tǒng)信息化的,不是做底層的基礎(chǔ)設(shè)施建設(shè),我們做上層人工智能和大數(shù)據(jù)帶來的智能算法,用智能的算法解決智能的問題,解決現(xiàn)實(shí)社會的痛點(diǎn)。我們也不是簡單通過云來提供服務(wù),我們并不是賣云,可以基于任何一朵云把云賦能,我們提供一個(gè)生態(tài)。我們是以解決政府和城市的痛點(diǎn)為出發(fā)點(diǎn),我們也不是只做一個(gè)點(diǎn),我們能夠做點(diǎn)線面結(jié)合的頂層設(shè)計(jì),并且能夠做從規(guī)劃到運(yùn)維到預(yù)測的動態(tài)的可持續(xù)發(fā)展模式。
綜合起來,其實(shí)我們有以下四個(gè)方面的優(yōu)勢。
第一,我們的技術(shù)優(yōu)勢。我們的城市計(jì)算平臺,里面涵蓋了大量的基于時(shí)空數(shù)據(jù)的人工智能算法,這個(gè)在國際上面屬于首創(chuàng)的,有絕對的自主知識產(chǎn)權(quán)。我們提出針對時(shí)空數(shù)據(jù)的管理算法,把現(xiàn)在云計(jì)算分布式計(jì)算環(huán)幕跟時(shí)空結(jié)合,能夠提供查詢效率一百倍甚至一千倍的結(jié)果,而且我們提供了多源數(shù)據(jù)融合的方法。你只有解決這些問題,才能真正處理好那些場景。
第二,經(jīng)驗(yàn)非常重要,除了技術(shù)本身,我們還需要對行業(yè)有深度的理解。這個(gè)環(huán)境涵蓋了交通、能耗、交通、公共安全,我們做了十幾年大量的垂直應(yīng)用,現(xiàn)在回過頭來才敢說可以做落地的頂層設(shè)計(jì)。同時(shí)這個(gè)領(lǐng)域里面非常缺乏人才,而這種人才很難很難培養(yǎng),需要用產(chǎn)學(xué)園一體化的機(jī)制培養(yǎng),而我們這個(gè)團(tuán)隊(duì)在學(xué)界和工業(yè)界兩邊都有涉足。我個(gè)人在四所大學(xué)里面擔(dān)任博導(dǎo)。所以這也是我們?nèi)瞬排囵B(yǎng)的優(yōu)勢。
第三,我們有強(qiáng)大的數(shù)據(jù)資源。京東有大量的用戶數(shù)據(jù),可以理解到城市很多方面的應(yīng)用,而且還有很多合作伙伴,以及我們有些特殊的聯(lián)合建模的方法,在數(shù)據(jù)不出各個(gè)平臺的情況下面可以聯(lián)合建模,保護(hù)用戶隱私的情況下面把數(shù)據(jù)的價(jià)值最大化,能夠打破技術(shù)壁壘,這也我們的技術(shù)。
第四,我們的品牌。我們有五百強(qiáng)的品牌,有網(wǎng)絡(luò)渠道,有跟近700多家金融行業(yè)合作的基礎(chǔ)。智慧城市最后落地一定不能靠政府補(bǔ)貼,要有自己的經(jīng)營模式,要有經(jīng)營場景,要給社會帶來回饋和利潤,這是我們的優(yōu)勢。
最后總結(jié)一句話“智能城市需要用大數(shù)據(jù)和人工智能一起打造,需要產(chǎn)學(xué)研一體化的培養(yǎng)人才,需要各界政府、企業(yè)和學(xué)界一起努力,讓我們一起共同來見證奇跡。”
{{item.content}}