甲骨文公司副總裁斯蒂芬·哈根報告實錄:
我也想感謝中國,以及GGIM共同聯(lián)合主辦了這個論壇。我的幻燈片是挺多的,但是因為要進行上傳,所以我跳過一些幻燈片,留更多的討論時間。
首先我想說一下我和吳教授以及武漢大學聯(lián)合開展了研究項目進行了合作,我們很高興。我們現(xiàn)在說一下阿波羅11的計劃,可以說所有基站都不如我們的手機,因為我們的手機相當于一萬各基站的數(shù)據(jù),所以我們現(xiàn)在不用擔心計算的能力了,因為我們現(xiàn)在要處理的是大數(shù)據(jù)的情況。也就是說,我們一方面要面對數(shù)據(jù)的巨大的量,然后包括數(shù)據(jù)的變化速度多快,包括我們有不同的眾籌,包括有不同的數(shù)據(jù)來源,像這些城市的地圖都用到了這些多元的數(shù)據(jù)。另外我們還有視頻、音頻、臉書還有twitter等等這些軟件。今天我們都講了Zettabytes是最大的,我們現(xiàn)在制訂的數(shù)據(jù)就是300Zettabytes這種級別。那么我們現(xiàn)在還沒有政策怎么應對這么大量的數(shù)據(jù)。這就是我們要說可持續(xù)發(fā)展,可持續(xù)發(fā)展實現(xiàn)地理數(shù)據(jù)是在核心之處,所以我們要與時俱進,從系統(tǒng)的交易和不同的格式,以博客等形式實時更新大數(shù)據(jù),就像吳教授剛才說的所有的實時數(shù)據(jù)流。那么我們的體系到底選擇用什么樣的數(shù)據(jù)呢?我們必須要有篩選和選擇,不能復制,要選擇相應的數(shù)據(jù)進行可視化的更改,因為我們可能有一些所謂天真的使用者,他們對復雜的體系不能操作,所以你必須給要他們提供可視化的這種地圖。比如說加入歷史的數(shù)據(jù)、歷史的數(shù)據(jù)庫,還要加入這種安全性,因為你作為政府部門有可能不是所有的數(shù)據(jù)都能讓他們說去。所以我想說我們在這種電網(wǎng)中,我們必須要有快速的一個體系決策,不需要人為地進行延遲的決策,而需要這種自動的決策體系。
我們有這樣的軟件可以獲取數(shù)據(jù),然后ISOTC211的標準,我們可以整合這樣的數(shù)據(jù),帕斯卡兩天前也提到這方面的問題。我們來自于各個源頭,得到了很多數(shù)據(jù)傳感器,人類提供的數(shù)據(jù)、各種機器的數(shù)據(jù)。上了他們的服務器中,它們的格式也都不一樣,我們可能要制定相應的標準,但是因為我們有不斷的新的傳感器的出現(xiàn),我們的標準跟不上,那我們該怎么辦呢?我們要有非常簡單的作為人為使用或者理解比較容易的模式,所以我們要審視一下原數(shù)據(jù)。我們的研究就是加入了一個原數(shù)據(jù)的層次,這個也就是說叫RDF原數(shù)據(jù)層次。比如這里有個物體我們起一個名字,另一個物體起另一個名字,也許你有同樣的物理物體,但是它可能被不同的用戶起了4-5個名字,那么我們通過原數(shù)據(jù)的層次,我們就說我通過這個層次的篩選我知道這是同一個物體,盡管它的名字不一樣。當我?guī)Ыo他用戶的時候,我會給用戶用一個名字來展示。所以就是以同意的方式來向用戶展示。在地理信息中這樣的技術(shù)已經(jīng)存在了。比如我們看一下哪各行業(yè)已經(jīng)做了這方面的解決方案了,大家可能都知道,我們的醫(yī)療衛(wèi)生領域已經(jīng)做到了這一點。比如說你作為一個醫(yī)生,你的醫(yī)院必須要以患者的情況來做決策,比如說你有同一個腫瘤問題、癌癥問題,你既有腫瘤掃描也有X光,也有其他的研究,那么這種結(jié)果必須要轉(zhuǎn)述成同一種的標準和記錄,這樣的話無論是醫(yī)生和護士都遵循這個標準來檢查你的狀況。還有一個叫用于基因醫(yī)療領域的SNOWMED,這是一個全球的標準,是基因腫瘤學所用的,比如DNA分析方面的。因為這個癥狀是以人類器官具體進行描述,都不用醫(yī)學術(shù)語進行展示。我們在空間角度,在地理信息角度也應該這么做,我們都是非常努力解決非常困難的問題,但是我們需要用這樣的圖形的形式解決這個問題。我們在談一百萬或者五千萬的傳感器,但是我們這里提到的是一萬一的基準,為什么有一萬億呢?下一步可能會達到十萬億的基準,在座的各位都出臺了相應的標準。還有我們搞情報的部門,他們都想追蹤所有的大數(shù)據(jù),知道個人在做什么事情,他們在干什么。所以呢,在這種萬億的情況之下,我們怎么樣能夠進行更好的追蹤,也就是說我們所有的傳感器、所有的數(shù)據(jù)我們可以把它們關聯(lián)在一起,可以進行詮釋,這就是我們能做的事情。
瓦妮莎剛才的幻燈比我這個好,這就是把開放式的數(shù)據(jù)進行連接,這是我們原數(shù)據(jù)的一個圖形,加注了所有的眾源數(shù)據(jù)進行聯(lián)系。我們大家都提到了云和眾源的情況,我們提到平臺,在平臺上怎么分解或者整合我們的數(shù)據(jù),我們既有了眾源數(shù)據(jù)進來,一般都以這種方式進來,比較分散、發(fā)散的。我提到“云”這個詞,云服務、公共云,像亞馬遜、微軟、IBM、谷歌它們都有公共云,也就是說把你所有的能源都上傳到云里頭。我們也可以跟其他的一樣提供這種公共云,另外還有私有云。像政府部門它們需要它們自己的私有云,還有不能泄露信息,比如醫(yī)院也一樣,你也希望你的銀行也有私有云,他們的技術(shù)是一樣的,只不過適用的地點不一樣。另外還有安全方面、保護方面。
想談一下開源的情況,前面的發(fā)言人都講了很多了開放源的情況。我們并不是說開放源不好,有很多開放源的平臺,有的時候如果我們硬件太多的話,現(xiàn)在需求是越來越下降了,但是軟件的成本和服務的成本卻是越來越增長了,所以隨著開源的發(fā)展,這個幻燈片看起來有點有趣。我們有一輛車,但是有很多的組件、部件、零部件,這就和開源一樣,你自己拿到數(shù)據(jù)源,自己要組織這輛車進行測試,所以開源組裝的過程中和這個車是一樣的,你的勞動力的成本是非常高的,你可以發(fā)現(xiàn)勞動力的成本比以前更多了,特別我希望今天就要把這個車組裝好,下午要開車回家。還有這樣的情況,開源是唯一正確的方式,給大家舉個例子,我和聯(lián)合國人居署談到,你給他們提供自愿的編程,我們下載開源的軟件,雖然這些都不花錢,但是很多情況下我們需要在你工作的區(qū)域向用戶展示一下他是怎么運行的,不要浪費時間,我們在很多地方把它叫樣式文件,就是我們從原形樣式開始,不要考慮太多最后要達到什么樣的目的,只要開始了漫漫征程,我們就可以了。這是一個游戲的過程,我們是最后要給大家提供唯一的一個平臺,我們可以把數(shù)據(jù)流、視頻流都加注這里面進行實時加速,包括安全性還有深入的分析放到不同的云上,公共云、私有云,這是最后的結(jié)果。但是我們這個過程結(jié)束就完了,我們要從開源開始,從樣式文件開始,也就是這個世界一個開源的世界。謝謝大家的關注!
{{item.content}}