
舍恩伯格認(rèn)為,數(shù)據(jù)的價(jià)值在變。以前小數(shù)據(jù)的時(shí)代,數(shù)據(jù)的價(jià)值是一次使用的價(jià)值,也就是在我們收集使用一次之后就沒用了,但是在未來(lái)真正數(shù)據(jù)的價(jià)值在于一而再再而三地使用這些數(shù)據(jù),它的價(jià)值從第一次使用到第二次使用,可能會(huì)翻四倍,所以數(shù)據(jù)的再使用更加重要。
舍恩伯格認(rèn)為,大數(shù)據(jù)下一個(gè)大的世界,也就是那些能夠提供功能最為豐富、數(shù)據(jù)量最大的數(shù)據(jù)平臺(tái)的公司。
文字實(shí)錄:
舍恩伯格:非常感謝邀請(qǐng)我參與本次論壇,我非常高興來(lái)到海爾。我也感到很榮幸能夠在這兒聽到庫(kù)斯瑪諾教授的演講,因?yàn)槲沂撬囊晃环劢z,我非常認(rèn)同他的平臺(tái)戰(zhàn)略,在他演講之后發(fā)言我很榮幸。
很多人問我到底什么是大數(shù)據(jù),大數(shù)據(jù)只是一個(gè)互聯(lián)網(wǎng)的延續(xù),這個(gè)大數(shù)據(jù)的含義要豐富很多。我們談到所謂的大數(shù)據(jù),大數(shù)據(jù)到底能給我們帶來(lái)什么,我們一定要超越互聯(lián)網(wǎng)。很多人看到互聯(lián)網(wǎng)想到在過去的十年當(dāng)中,互聯(lián)網(wǎng)已經(jīng)從根本上改變了消費(fèi)者和廠家之間的關(guān)系,就像消費(fèi)者和用戶他現(xiàn)在可以通過互聯(lián)網(wǎng)的平臺(tái)買書買家電,可以直接送到他們的家庭,這樣一來(lái)的話交易的成本顯著地降低了。但是,我覺得另外有一場(chǎng)即將到來(lái)的革命,有一家創(chuàng)業(yè)的企業(yè),是由一位華盛頓大學(xué)計(jì)算機(jī)系的教授,他也是根據(jù)大數(shù)據(jù)創(chuàng)立了一系列的企業(yè),之前他也創(chuàng)辦了非常成功的大數(shù)據(jù)的企業(yè),并把它出售。這些企業(yè)是做什么的呢?他到所有電子商務(wù)的公司去抓取數(shù)據(jù),他可以抓取100萬(wàn)家電產(chǎn)品的11個(gè)價(jià)格數(shù)據(jù),他每天都來(lái)抓這些數(shù)據(jù),來(lái)預(yù)測(cè)每一個(gè)家電產(chǎn)品在未來(lái)一到兩周價(jià)格的走向,比如說你要買一臺(tái)洗衣機(jī)的話,你上這個(gè)網(wǎng)站找到你要購(gòu)買的型號(hào),網(wǎng)站就會(huì)告訴你這個(gè)洗衣機(jī)的價(jià)格在未來(lái)一周的走勢(shì)到底會(huì)上升還是下降,這樣一來(lái)對(duì)于用戶來(lái)說就是你應(yīng)該現(xiàn)在就購(gòu)買還是再等一等。
這個(gè)數(shù)據(jù)的精度達(dá)到了77%,可以看到它對(duì)價(jià)格走勢(shì)的預(yù)測(cè)非常精準(zhǔn),而且他們對(duì)自己提供的預(yù)測(cè)非常有自信,就是說如果消費(fèi)者根據(jù)他們的預(yù)測(cè)購(gòu)買,但是多付了錢的話,他愿意來(lái)補(bǔ)這個(gè)差價(jià)。他完全是基于這個(gè)大數(shù)據(jù),基于250億個(gè)數(shù)據(jù)點(diǎn)。對(duì)于用戶來(lái)說通過他這個(gè)服務(wù),每個(gè)家電平均可以節(jié)省102美金的價(jià)格。有人就會(huì)說這是一個(gè)大數(shù)據(jù),因?yàn)樗麄兪褂昧舜罅康臄?shù)據(jù),當(dāng)然我們這種理解是情有可原的,到15年之前他們就開始收集大量的數(shù)據(jù)。
我們可以看一下人體的基因,也就是構(gòu)成我們遺傳線性的基因。每個(gè)人的基因都是不同的,我們一共有30億對(duì)的DNA,十年之前這是我們對(duì)一個(gè)完整的認(rèn)證DNA進(jìn)行了測(cè)試,整個(gè)的花費(fèi)達(dá)到了10億美金,而且?guī)缀趸?0年的時(shí)間完成這項(xiàng)工作。到今天我們對(duì)一個(gè)人整個(gè)的基因測(cè)試,只要在一個(gè)實(shí)驗(yàn)室花2到3天的時(shí)間,花2000美金就夠了。
這個(gè)就是我們?nèi)祟惪茖W(xué)能力巨大的變化,就是利用這種大數(shù)據(jù)所要達(dá)到的能力。這個(gè)是對(duì)于我們?cè)趺礃尤ソM織和理解這個(gè)世界有非常大的影響。這個(gè)在指向數(shù)據(jù)之山的這種規(guī)模,來(lái)幫助我們解釋需要多少的數(shù)據(jù)。
其實(shí)我們?nèi)绻厥龅?987年,在全世界我們大概有26.2億比特的數(shù)據(jù),那時(shí)候大多數(shù)的數(shù)據(jù)都是模擬數(shù)據(jù),快進(jìn)到2007年的20年之后,總的信息的量增長(zhǎng)了100多倍,如果我要在這張圖當(dāng)中來(lái)描述這樣的一個(gè)數(shù)據(jù)之山的話,這個(gè)比例真的是非常大,我很難畫出來(lái)。所以你看到我們現(xiàn)在這個(gè)數(shù)據(jù)積累的速度是史無(wú)前例的快。你看到西方非常大的一個(gè)發(fā)明是15世紀(jì)印刷術(shù)的發(fā)明,那時(shí)候信息的翻倍要花50年,但是現(xiàn)在20年當(dāng)中,我們這個(gè)信息的增長(zhǎng)量就達(dá)到100倍,所以這是非常巨大的一個(gè)變化,這個(gè)是大數(shù)據(jù)帶來(lái)的一種變化。
另外1997年幾乎所有的信息都是模擬格式的,在2000年就是這個(gè)白色的柱子,75%的全世界的信息還是模擬格式的,只有25%是數(shù)字信息。就在13年之后也就是今天,你看98%的數(shù)據(jù)已經(jīng)是數(shù)字信息,只有2%的是模擬格式,這一切都顛倒了。帶來(lái)的結(jié)果就是我們可以很好地用這個(gè)數(shù)據(jù)的信息,更加易于用這些信息來(lái)去做用模擬數(shù)據(jù)能做的事情,所以從規(guī)模方面對(duì)于大數(shù)據(jù)來(lái)說它的變化非常大。
你看到最最重要的是什么呢?隨著大數(shù)據(jù)的革命,它的特點(diǎn)就是更多更亂,還有相關(guān)性。這三個(gè)大數(shù)據(jù)的特點(diǎn)我們一定要重視,第一個(gè)我們現(xiàn)在有越來(lái)越多的數(shù)據(jù),我們可以收集、分析和一個(gè)我們要研究這個(gè)問題相關(guān)的更多的信息了,不是所有的數(shù)據(jù)點(diǎn)都重要,而是這個(gè)問題我們?cè)谶@個(gè)數(shù)據(jù)當(dāng)中可以捕捉多少的信息,現(xiàn)在更多了。那么有的時(shí)候你可以看到總的數(shù)據(jù)是6.4萬(wàn),你捕捉了6.39萬(wàn),那幾乎就是全部了,但是有的時(shí)候,我們用一部分的樣本就可以讓這個(gè)數(shù)據(jù)來(lái)說話,它能夠給我們揭示出一個(gè)問題的實(shí)質(zhì)。但是現(xiàn)在這些相關(guān)的信息越來(lái)越多了。我大多數(shù)打交道的公司現(xiàn)在還是只使用了很少一部分的數(shù)據(jù),他們只依賴于一小部分?jǐn)?shù)據(jù)的樣本,來(lái)去回答他們的這個(gè)管理方面的問題。
但是大多數(shù)的情況下你可以看到,他們也能夠得到很多的洞識(shí),這些洞識(shí)能夠幫助他們做出選擇做出決策。但是這些數(shù)據(jù)可能不能夠幫助他們揭示他們知道的第三個(gè)選擇,因?yàn)闃颖咎〉脑捘銢]有辦法得到這方面的啟示。如果你要去做分析,去做決策,有的時(shí)候你必須要利用好現(xiàn)在更多的信息。只有你分析了所有相關(guān)現(xiàn)象、所有的數(shù)據(jù),或者說大多數(shù)的數(shù)據(jù),有的時(shí)候你才能夠看到你沒有看到的一些問題和選擇。所以我們要學(xué)會(huì)善用我們現(xiàn)在更多的數(shù)據(jù)。
現(xiàn)在大數(shù)據(jù)時(shí)代數(shù)據(jù)的第二個(gè)特點(diǎn)就是它看上去非常的混亂。我們總是希望事情有一個(gè)非常準(zhǔn)確的、非常明確的方向,現(xiàn)在在這個(gè)大數(shù)據(jù)的時(shí)代,在這個(gè)微觀的層面我們往往找不準(zhǔn)方向。
隨著這個(gè)特點(diǎn)有兩個(gè)相關(guān)的特性,這就引到了我們第三個(gè)特點(diǎn),就是相關(guān)性。我們要學(xué)會(huì)在這些數(shù)據(jù)當(dāng)中找因果關(guān)系。在大數(shù)據(jù)當(dāng)中,我們?cè)谒拿媲耙欢ㄒ浅Vt卑,我們必須要去問為什么,然后尋找這些數(shù)據(jù)之間的因果關(guān)系、他們的相關(guān)性。很多的情況下你只需要問為什么、什么就可以了。給大家舉一個(gè)例子,這個(gè)例子就是機(jī)器翻譯的例子。在20世紀(jì)50年代美國(guó)國(guó)防部對(duì)美國(guó)的研究人員授予9000萬(wàn)美元,讓他們?nèi)ゴ蛟煲粋€(gè)軟件,能夠自動(dòng)把俄語(yǔ)翻成英文。在冷戰(zhàn)時(shí)期這個(gè)應(yīng)用是非常需要的。在20世紀(jì)50年代研究人員覺得幾年就可以解決這個(gè)問題,他們?cè)囍ソ淌谟?jì)算機(jī)大概180個(gè)英語(yǔ)的語(yǔ)法規(guī)則和俄羅斯的語(yǔ)法規(guī)則,然后他們?cè)谡Z(yǔ)言的翻譯當(dāng)中試著去提取基本的規(guī)則,然后試著去教會(huì)計(jì)算機(jī)這些規(guī)則。在1962年他們發(fā)現(xiàn)他們大大的失敗了,失敗的非常慘,到最后他們要放棄這個(gè)項(xiàng)目。
25年當(dāng)中也沒發(fā)生什么,也沒有什么太大的進(jìn)展,突然之間有一個(gè)公司IBM想了一個(gè)創(chuàng)意,他們放棄理解為什么兩個(gè)詞會(huì)出現(xiàn)在一起?他們放棄了讓計(jì)算機(jī)去理解為什么這兩個(gè)詞要搭在一起,他們只是采取了統(tǒng)計(jì)分析的方法,去尋求什么而不是為什么。然后他們把加拿大議會(huì)探討的一些會(huì)議稿拿過來(lái),因?yàn)榧幽么笥袃煞N語(yǔ)言,一個(gè)是英語(yǔ)一個(gè)是法語(yǔ),所以你看他們拿了幾百萬(wàn)頁(yè)的非常精確翻譯的這兩個(gè)語(yǔ)言之間的文稿,然后在電腦上進(jìn)行了統(tǒng)計(jì)分析。就是英語(yǔ)的某一個(gè)詞,大多數(shù)的時(shí)候翻譯成什么樣的法語(yǔ)詞,然后法語(yǔ)詞又是怎樣翻譯成英文。到最后,他們就找出了一些統(tǒng)計(jì)的相關(guān)性。他們沒有回答為什么,而是回答了什么。然后呢,他們?cè)谶@個(gè)機(jī)器翻譯方面就達(dá)到了一個(gè)非常大的成就。而他們這樣做的時(shí)候根本就沒有去教授計(jì)算機(jī)語(yǔ)法規(guī)則。
那么IBM最大的問題,就是他們沒有足夠的數(shù)據(jù)。在那個(gè)時(shí)候大數(shù)據(jù)時(shí)代還沒有到來(lái),他們沒有足夠的數(shù)據(jù)。[page]
再過15年另外一個(gè)公司出現(xiàn)了就是谷歌,谷歌用了絕對(duì)一樣的做法,但是這次谷歌不僅僅拿了加拿大議會(huì)的會(huì)議稿,同時(shí)他也用了因特網(wǎng)上幾十億的頁(yè)面,他們抓取了幾十億頁(yè)面的數(shù)據(jù),然后去進(jìn)行統(tǒng)計(jì)分析,然后去分析一些翻譯與詞的相關(guān)性。在規(guī)模上這是非常大的一個(gè)增長(zhǎng),其實(shí)他們抓的這個(gè)樣本比IBM抓的這個(gè)樣本要多可能上千倍、上萬(wàn)倍甚至上百萬(wàn)倍。與此同時(shí)谷歌使用的因特網(wǎng)很多的數(shù)據(jù)都是非常亂的,但是因?yàn)樗麄冊(cè)谝?guī)模上做大了這么多,所以他們?cè)谫|(zhì)量上稍微有一點(diǎn)犧牲是沒有問題,沒有關(guān)系的。谷歌它的這個(gè)翻譯可能質(zhì)量并不是特別好,但是比我們IBM以前做的要好得多,這個(gè)主要是因?yàn)樗麄儼堰@個(gè)混亂性和相關(guān)性解決得非常好,聯(lián)系得非常好。
其實(shí)網(wǎng)絡(luò)公司在這方面例子很多,但很多人會(huì)說這跟我有什么關(guān)系?我又不是網(wǎng)絡(luò)公司。多倫多有一些研究人員他們?cè)谧鍪裁?他們正在使用大數(shù)據(jù)的分析來(lái)去拯救一些早產(chǎn)兒,早產(chǎn)兒非常容易感染。我們一天會(huì)測(cè)他們的體溫三到四次,但是往往他們感染之后再發(fā)現(xiàn)就太晚了,在那個(gè)時(shí)候給他們抗生素其實(shí)已經(jīng)沒什么用了。那么多倫多的研究人員都做了些什么呢?他們用了一些特殊的傳感器收集早產(chǎn)兒的生命體征,一秒鐘就能收集1200條數(shù)據(jù),然后再積累幾小時(shí)、幾天、一個(gè)月,很多早產(chǎn)兒的數(shù)據(jù)。然后在這個(gè)基礎(chǔ)上去做了相關(guān)性的分析。有一些數(shù)據(jù)質(zhì)量非常高,有一些他們到最后進(jìn)行了分析,發(fā)現(xiàn)了沒有什么太大的用。通過這些數(shù)據(jù)的分析,他們發(fā)現(xiàn)他們可以在孩子的感染之前24小時(shí)就能夠發(fā)現(xiàn)這個(gè)跡象,這是非常大的進(jìn)展,他們能夠拯救這些早產(chǎn)兒的生命。
他們通過這樣的研究,就可以預(yù)測(cè)出孩子可能會(huì)感染,這和我們直覺相反,他們研究的結(jié)果就是一個(gè)孩子在感染之前生命體征不會(huì)出現(xiàn)混亂,反而會(huì)穩(wěn)定。很多的醫(yī)生在這之前他們?cè)诤⒆芋w征變穩(wěn)定之前肯定就高高興興下班了,但是在這個(gè)研究結(jié)果出臺(tái)之后,醫(yī)生在生命體征穩(wěn)定之后他們必須要留下來(lái),因?yàn)檫@顯示著孩子更加有可能會(huì)感染。通過這個(gè)措施,早產(chǎn)兒的死亡率大大減少,這就是一個(gè)非常實(shí)際的例子,大數(shù)據(jù)能幫我們做什么。
現(xiàn)在對(duì)于早產(chǎn)兒的例子我們不知道為什么,但是我們知道是什么,這已經(jīng)夠了,因?yàn)檫@已經(jīng)能夠幫助我們救這些孩子的命了。當(dāng)然對(duì)于商業(yè)來(lái)說,大數(shù)據(jù)能夠做些什么呢?我希望大家在聽我的發(fā)言之后能夠意識(shí)到,關(guān)鍵的一點(diǎn)就是數(shù)據(jù)的價(jià)值在變。以前小數(shù)據(jù)的時(shí)代,數(shù)據(jù)的價(jià)值是他一次使用的這種價(jià)值,也就是他在我們收集使用一次之后就沒用了,但是在未來(lái)真正數(shù)據(jù)的價(jià)值在于一而再再而三地使用這些數(shù)據(jù),它的這個(gè)價(jià)值從第一次使用到第二次使用,可能會(huì)翻四倍,所以數(shù)據(jù)的再使用更加重要。
給大家舉一些例子,沃爾瑪可能有著實(shí)體店最大的數(shù)據(jù)庫(kù),它是世界上最大的零售商,所以這一點(diǎn)非常自然,非常易于理解。他們會(huì)記錄每一筆交易,然后把這些交易的數(shù)據(jù)存在自己的電腦當(dāng)中。幾年之前他們大數(shù)據(jù)部門進(jìn)行了一些數(shù)據(jù)分析的工作,他們發(fā)現(xiàn)就在熱帶風(fēng)暴來(lái)臨之前手電筒和電池的銷售會(huì)上升,這個(gè)沒什么奇怪,大家都想得到但是,與此同時(shí)他們也發(fā)現(xiàn),poptarts這種食物的銷售也會(huì)隨之上升。這是一種非常甜的零食,他們不知道為什么。他們可能知道一點(diǎn)點(diǎn)為什么,但是他們不在乎。他們?cè)诤醯氖?,把這個(gè)poptarts放在收銀臺(tái)旁邊和手電筒和電池放在一起,這個(gè)大大提升了它們?cè)陲Z風(fēng)來(lái)臨之前的銷售,這個(gè)就是大家在重新使用數(shù)據(jù)的時(shí)候可以得到的一些洞察。
我們?cè)倏纯戳硗庖粋€(gè)公司的例子。在以前電話公司可以監(jiān)控我任何的一切,就像邁克爾剛才講的幾年以前這一切都變了。今天我們認(rèn)為蘋果或者三星或者海爾他們掌握著我,因?yàn)樯a(chǎn)著我的手機(jī),他們知道我們隨時(shí)隨地都在做什么,或者谷歌掌控著我,因?yàn)樗麄冊(cè)谥谱靼沧康牟僮飨到y(tǒng)。他們捕捉了所有的數(shù)據(jù),但是也許是,也許不是,也許還有其它的公司,這樣做自己的定位,就是在這個(gè)數(shù)據(jù)的流當(dāng)中他們采取一個(gè)中介公司的定位。
inrix是一個(gè)西雅圖的公司,它使用了微軟的專利,它們所做的就是幫助人們導(dǎo)航,用實(shí)時(shí)的交通流量的數(shù)據(jù)來(lái)幫助上下班的人,然后幫助他們躲避交通堵塞。
inrix給你們展示實(shí)時(shí)的地圖,然后告訴你們什么地方最堵。inrix它的數(shù)據(jù)來(lái)源是什么呢?是從蘋果公司還是電訊公司?不是。每一個(gè)使用inrix應(yīng)用的用戶,與此同時(shí)也成為他們的一個(gè)傳感器,他把他的車速的數(shù)據(jù)傳給inrix,inrix有1億個(gè)用戶就有1億個(gè)傳感器,每天搜集的數(shù)據(jù)是40億,對(duì)于美國(guó)的交通狀況一目了然。所以inrix在整個(gè)數(shù)據(jù)服務(wù)的定位非常清晰。真正的實(shí)質(zhì)是什么呢?也就是inrix擁有了這么大的數(shù)據(jù)進(jìn)行了重復(fù)的使用,所以他們又給用戶提供了巨大的價(jià)值,也就是說這個(gè)數(shù)據(jù)取之于民、用之于民。inrix通過數(shù)據(jù)的分析預(yù)測(cè)經(jīng)濟(jì)的健康度,因?yàn)檎麄€(gè)交通的狀況和經(jīng)濟(jì)增長(zhǎng)的狀況是緊密相關(guān)的,所以inrix是預(yù)見到了2009年的經(jīng)濟(jì)衰退,盡管那個(gè)時(shí)候所有的政治家都說是欣欣向榮的,但是他發(fā)現(xiàn)整個(gè)的交通狀況有所減少或者是急劇下降,所以他就預(yù)測(cè)美國(guó)的經(jīng)濟(jì)要衰退。然后有很多的對(duì)沖基金也使用了inrix的數(shù)據(jù),因?yàn)樗麄儼l(fā)現(xiàn)那些購(gòu)物中心在周末的交通量和這些大賣場(chǎng)的銷售額是相當(dāng)有關(guān)系的,所以他們也是利用inrix的數(shù)據(jù)在這些企業(yè)發(fā)布季報(bào)的時(shí)候來(lái)買賣股票。所以inrix可以看到它通過這個(gè)大數(shù)據(jù)的分析和重復(fù)的使用,創(chuàng)造了巨大的價(jià)值。
給大家舉另外一個(gè)例子,漢莎公司,它是全球很大的一家航空公司,有350架飛機(jī)。它需要非常精確的天氣預(yù)報(bào)才可以更好地提供服務(wù)。天氣預(yù)報(bào)在過去十多年當(dāng)中由于模型更加的健全,可以看到這個(gè)精度提高了。但是這個(gè)精度還沒有達(dá)到漢莎航空公司的要求,他說那我在飛機(jī)飛行的時(shí)候也收集了很多機(jī)艙外的像濕度、溫度或者是氣壓等很多方面的數(shù)據(jù),所有這些數(shù)據(jù)都是飛機(jī)一邊在飛一邊在收集的。但是飛機(jī)往往在收集這些數(shù)據(jù)之后就把這些數(shù)據(jù)放在一邊了。但是漢莎說我們可以把這些數(shù)據(jù)重新再利用,等飛機(jī)一旦降落以后,就把在飛行過程當(dāng)中收集的數(shù)據(jù),當(dāng)然這是由350架飛機(jī)收集的,數(shù)據(jù)一旦發(fā)回德國(guó)的總部就來(lái)進(jìn)行分析。由于這個(gè)數(shù)據(jù)每天都是實(shí)時(shí)的,可以看到他們把整個(gè)天氣預(yù)報(bào)精度提升了7%,大家可以想一想如果天氣預(yù)報(bào)精度可以提高這么大的話,對(duì)整個(gè)航空公司的效益可以產(chǎn)生多大積極的影響?
再來(lái)看一家物流公司UPS,它在全球運(yùn)貨的卡車有6萬(wàn)輛,所有運(yùn)貨的車都有一個(gè)黑盒子,會(huì)收集位置、速度等很多信息,幾乎是實(shí)時(shí)地把這些數(shù)據(jù)發(fā)回到UPS總部去,然后UPS總部會(huì)對(duì)這些數(shù)據(jù)進(jìn)行分析。對(duì)于UPS而言,他希望通過這個(gè)數(shù)據(jù)的分析能夠減少對(duì)車隊(duì)的維護(hù)量。與此同時(shí),還可以減少這些運(yùn)貨卡車的空駛率。UPS發(fā)現(xiàn)車輛右轉(zhuǎn)的話要比左轉(zhuǎn)快,因?yàn)樽筠D(zhuǎn)要等燈,右轉(zhuǎn)不用等燈。通過新的軟件導(dǎo)航系統(tǒng)讓更多車輛進(jìn)行右轉(zhuǎn),即便轉(zhuǎn)彎也是通過幾個(gè)右轉(zhuǎn)來(lái)實(shí)現(xiàn)。僅此一項(xiàng)改革,在2011年UPS整個(gè)行駛的里程數(shù)就減少了3000萬(wàn)英里,減少了1000萬(wàn)噸汽油的消耗和減少了3萬(wàn)噸二氧化碳的排放。但是比這個(gè)更好的是,通過這個(gè)數(shù)據(jù)的分析,UPS可以對(duì)車輛進(jìn)行預(yù)防性的維護(hù),所謂預(yù)防性維護(hù)也是你可以預(yù)見這個(gè)車輛部件,提前可以知道部件什么時(shí)候會(huì)出故障,你不用等到這個(gè)車實(shí)際拋錨了再維修,而是未雨綢繆把出故障的部件提前進(jìn)行預(yù)測(cè)。對(duì)海爾而言,同樣可以進(jìn)行大家電的維護(hù),而且這個(gè)數(shù)據(jù)也可以讓這個(gè)設(shè)計(jì)師更好地設(shè)計(jì)出未來(lái)故障更少的產(chǎn)品,肯定會(huì)為用戶創(chuàng)造更多的價(jià)值。
所以我們可以看到在全球發(fā)生的一個(gè)趨勢(shì),就是從原來(lái)的生產(chǎn)制造的思維方式到把自己視作一個(gè)數(shù)據(jù)的平臺(tái)。在19世紀(jì),科莫多莫瑞(音)就首先想到了這個(gè)事情,曾經(jīng)因?yàn)橐淮问鹿适軅?,然后他就不能在美?guó)海軍繼續(xù)服役了,只能在辦公室辦公。他在辦公室發(fā)現(xiàn)了大量的文件,他發(fā)現(xiàn)了很多的老船員的記錄本,但是科莫多他說這些航行的記錄是非常有價(jià)值的,他就雇傭了100個(gè)人,花了10年的時(shí)間對(duì)這些航程記錄本進(jìn)行了分析,然后分析每一條航線在哪一個(gè)季節(jié)是最佳的通行時(shí)間。他最終發(fā)現(xiàn)美國(guó)的艦隊(duì)整個(gè)的航線選擇效率是非常低效,但是如果能夠通過這個(gè)新的優(yōu)化的航線避開逆風(fēng)的話,完全是可以提升美國(guó)艦隊(duì)的效率。他就通過對(duì)老的航行記錄本的分析設(shè)計(jì)了全新的航行圖,極大地提升了美國(guó)艦隊(duì)的效率,可以看到這是上個(gè)世紀(jì)的大數(shù)據(jù),他花了10年的時(shí)間分析了這些數(shù)據(jù),他把這些人稱之為小的計(jì)算機(jī)。對(duì)這些數(shù)據(jù)量的分析完全創(chuàng)造了一個(gè)數(shù)據(jù)的平臺(tái),當(dāng)然那時(shí)候他并沒有把它稱之為一個(gè)平臺(tái)。邁克爾,對(duì)不起,這不是你用的詞,但是他把它稱之為一個(gè)浮動(dòng)的觀測(cè)站。他完全理解數(shù)據(jù)作為一個(gè)資源是非常有價(jià)值的。
從科莫多莫瑞150多年以前快進(jìn)到現(xiàn)在,我們可以看到另外一家公司深刻地理解了這個(gè)趨勢(shì),這就是谷歌公司。大家可能聽說過谷歌的無(wú)人駕駛汽車,這個(gè)汽車是專門收集街景,通過谷歌地圖大家可以看到街景左右的實(shí)時(shí)狀況。這個(gè)車在街上收集街景,這個(gè)也引起了人們對(duì)隱私的關(guān)注。谷歌的車不僅僅是拍照,還可以通過雷達(dá)來(lái)收集道路的一些信息。比如說交通信號(hào)燈的頻率,還有在手機(jī)信號(hào)的信息,和wifi供應(yīng)商的信息??梢钥吹剿占舜罅康男畔?,因?yàn)楣雀柰耆斫膺@個(gè)車就是一個(gè)數(shù)據(jù)收集的平臺(tái),而且這些數(shù)據(jù)不僅僅是為了提供街景,而是可能更好地來(lái)改善他們的服務(wù),他可以更好地改善安卓的手機(jī)定位,這樣的話即便你的手機(jī)沒有GPS手機(jī)信號(hào)的話也可以更精確地定位。通過這些信息,也可以更好地給谷歌正在開發(fā)的無(wú)人駕駛的汽車提供導(dǎo)航。谷歌完全理解這個(gè)車就是他們數(shù)據(jù)收集的平臺(tái),他們通過這個(gè)平臺(tái)盡可能多的去收集數(shù)據(jù)。
可以看到隨著數(shù)據(jù)量的增加,他們肯定在這個(gè)平臺(tái)上可以確立自己的霸主地位??梢钥吹剿鼘⒂绊懙南乱粋€(gè)行業(yè)就是汽車行業(yè)。我們知道在汽車行業(yè)一個(gè)領(lǐng)先的廠商就是寶馬公司,寶馬公司最近也宣布他們將會(huì)給他們的車裝備互聯(lián)的功能,這個(gè)車在行駛的過程當(dāng)中把收集的數(shù)據(jù)發(fā)回到寶馬公司總部,而且他們對(duì)這一項(xiàng)服務(wù)是收一定費(fèi)用的。但是,對(duì)用戶而言這不僅僅是這么一項(xiàng)簡(jiǎn)單的服務(wù),寶馬公司是可以通過這種方式實(shí)時(shí)來(lái)收集關(guān)于這輛車和周邊環(huán)境的一個(gè)功能,而且可以為用戶提供預(yù)防性維護(hù),而且可以更好地幫助汽車來(lái)定位,這種方式就可以成為我們剛才說的,成為inrix的公司。這樣一來(lái)的話,他們就可以摧毀蘋果公司,通過手機(jī)終端希望對(duì)這個(gè)用戶的鎖定。如果我是寶馬公司一個(gè)用戶的話,我可能非常喜歡這一項(xiàng)服務(wù),我肯定希望這一項(xiàng)功能能夠普及到更多的汽車當(dāng)中,當(dāng)然這里面存在一個(gè)開放的系統(tǒng)的問題,這是寶馬公司必須要考慮的,這是他們一個(gè)差異化的戰(zhàn)略還是收入的來(lái)源。
我覺得大數(shù)據(jù)下一個(gè)大的世界,也就是那些能夠提供功能最為豐富、數(shù)據(jù)量最大的數(shù)據(jù)平臺(tái)的公司。在家電行業(yè)如果有誰(shuí)能夠做到這一點(diǎn)的話,肯定獲得大數(shù)據(jù)時(shí)代的成功。我相信海爾在這個(gè)領(lǐng)域具有巨大的優(yōu)勢(shì)和機(jī)會(huì)。如果有其他的一些配套的公司能夠利用這些大數(shù)據(jù)為客戶提供一些他們之前所沒有想到的服務(wù)的話,肯定可以幫助這個(gè)平臺(tái)的領(lǐng)導(dǎo)者獲得成功。就像蘋果公司,它通過運(yùn)用的平臺(tái)不光是讓運(yùn)用的開發(fā)者開發(fā)出大量的用戶喜聞樂見的應(yīng)用,而且可以給這些開發(fā)商提供大量的用戶數(shù)據(jù)?,F(xiàn)在我們可以看到這些應(yīng)用終端是越來(lái)越增加,而且具備了大量的傳感器,而且擁有了wifi的連接功能,你通過這些數(shù)據(jù)并不是來(lái)跟蹤用戶,而是可以進(jìn)一步提升現(xiàn)有服務(wù)的質(zhì)量,或者是推出之前想都沒有想到過的全新的服務(wù)。
與此同時(shí)我們可以看到大數(shù)據(jù)時(shí)代所謂的專家也被摧毀了,因?yàn)樵谛畔⒎忾]的時(shí)代我們迷信專家,我們覺得他是足智多謀的或者是有理論的框架的。如果我去找一個(gè)醫(yī)生,我說做一個(gè)手術(shù),我說你做過多少手術(shù)?他說我這輩子就做三到四個(gè)手術(shù),你會(huì)不會(huì)相信這樣的醫(yī)生呢?但是這種情況在大數(shù)據(jù)時(shí)代是不會(huì)發(fā)生的,就像谷歌他的首席設(shè)計(jì)師,他專門測(cè)試過他們的搜索框陰影到底應(yīng)該有多少種,哪一種是最合適的。他的老板說你要測(cè)試這41個(gè)不同的陰影,他拒絕,他說1種就夠了,然后他就辭職了。實(shí)際上我們看到不同的測(cè)試,谷歌公司發(fā)現(xiàn)一種特定的陰影的搜索框能夠給他們帶來(lái)更多的搜索量和更多的收入,這也是大數(shù)據(jù)時(shí)代的威力。
那么在小數(shù)據(jù)時(shí)代,收集數(shù)據(jù)的難度非常之大,我們有時(shí)候會(huì)把這些數(shù)據(jù)進(jìn)行一些優(yōu)化處理,比如說我來(lái)扔一個(gè)硬幣,如果是正面,大家想一想硬幣正面的概率是多少呢?50%,非常好,這是經(jīng)典的教科書的回答。從現(xiàn)在開始,我們只是說就是50%的概率,我再來(lái)扔一次硬幣,然后你就說我就不用看了,50%的可能,上次正面這次反面,我們把它稱之為一種兩維的世界、黑白的世界,是正面或者是反面的世界,我們稱之為一個(gè)兩元的世界,這是所謂在小數(shù)據(jù)時(shí)代的世界。而在大數(shù)據(jù)時(shí)代方法完全不一樣了,我扔一個(gè)硬幣如果是正面,我扔了一次之后就假定到現(xiàn)在為止這個(gè)概率是百分之百,因?yàn)槲胰恿艘淮问钦?,然后我扔了第二次是反面。我扔了兩次,這是50%對(duì)半開。再扔一次,這是一個(gè)2對(duì)1的一個(gè)概論,我不斷扔硬幣,每次的結(jié)果都是對(duì)這一個(gè)硬幣的概率而不是通用的所有硬幣的概率,完全有這個(gè)可能。有可能這個(gè)硬幣正面的比重稍微大一點(diǎn),那么它正面出現(xiàn)的概率就高一點(diǎn),所以這樣我們就可以從過去所有的經(jīng)歷,從過去每一個(gè)錯(cuò)誤當(dāng)中學(xué)習(xí)到新的知識(shí),因?yàn)槊恳淮螌?duì)過去的錯(cuò)誤的認(rèn)識(shí)都可以幫助我們更好地來(lái)提升自己的數(shù)據(jù),來(lái)改善我們對(duì)未來(lái)的預(yù)測(cè)。
對(duì)于谷歌而言,他們對(duì)每一次搜索的結(jié)果都要進(jìn)行分析,來(lái)幫助他們更好地來(lái)預(yù)測(cè)未來(lái)搜索的結(jié)果,然后因此來(lái)改變他們的算法。
對(duì)于大數(shù)據(jù)時(shí)代,我們要有大數(shù)據(jù)的頭腦和理念。我們一定要有一個(gè)正確的心態(tài)來(lái)去理解這些大數(shù)據(jù)的價(jià)值,對(duì)于我們的公司來(lái)說,對(duì)于我們的商業(yè)生態(tài)圈來(lái)說,對(duì)社會(huì)來(lái)說都是一樣的。剛才張總裁也是講到了這一點(diǎn),我覺得他所說的和海爾所做的,都體現(xiàn)了這一點(diǎn),體現(xiàn)了海爾對(duì)生態(tài)系統(tǒng)的重視,我們?cè)谌澜缍紤?yīng)該做到這一點(diǎn)。
未來(lái)競(jìng)爭(zhēng)優(yōu)勢(shì)將來(lái)自于何處呢?不一定來(lái)自于制造,我想說也不一定來(lái)自于真實(shí),我覺得它是來(lái)自于數(shù)據(jù)的,還有收集、分析和使用數(shù)據(jù)的能力。在這個(gè)意義上來(lái)說,海爾它有非常大的優(yōu)勢(shì),它可以成為全世界大數(shù)據(jù)的領(lǐng)導(dǎo)者來(lái)去創(chuàng)造豐富創(chuàng)新的大數(shù)據(jù)的一個(gè)生態(tài)圈。
那么,在這一切發(fā)生的時(shí)候,我們將會(huì)為之喝彩,謝謝。
{{item.content}}