華東師大云計(jì)算與大數(shù)據(jù)研究中心是一個(gè)以建設(shè)國(guó)際性的大數(shù)據(jù)協(xié)同創(chuàng)新平臺(tái)和研發(fā)中心為目的,基于典型的中國(guó)式應(yīng)用、以開(kāi)展國(guó)際前沿的研究和開(kāi)發(fā)為使命的新型研究機(jī)構(gòu)。該中心依托華東師大及“上海高校知識(shí)服務(wù)平臺(tái)”,吸引了業(yè)內(nèi)的國(guó)際“大咖”加盟該中心指導(dǎo)委員會(huì)。其中,學(xué)術(shù)委員會(huì)主任由澳大利亞新南威爾士大學(xué)教授、數(shù)據(jù)庫(kù)研究實(shí)驗(yàn)室主任林學(xué)民擔(dān)任,中心主任由單名謙、周傲英共同擔(dān)綱。不難看出,該機(jī)構(gòu)研究人員不僅國(guó)籍橫跨歐亞美、名譽(yù)頭銜也是領(lǐng)專業(yè)領(lǐng)域風(fēng)騷,其研究背景的國(guó)際性可見(jiàn)一斑。據(jù)中心負(fù)責(zé)人介紹,訪問(wèn)學(xué)者的研究機(jī)制將成為中心的主要發(fā)展方式,今后將有更多的IT界國(guó)際精英聚集在此,成為中國(guó)的學(xué)術(shù)“硅谷”。
IT界始終是一個(gè)實(shí)踐性極強(qiáng)的領(lǐng)域,尤其是“云計(jì)算”和“大數(shù)據(jù)”這種與現(xiàn)實(shí)的產(chǎn)業(yè)發(fā)展、用戶模式改革緊密聯(lián)系的概念,不僅需要學(xué)理上的假設(shè)與探討,更需要即時(shí)將研究成果反饋于業(yè)界和用戶。華東師大副校長(zhǎng)朱自強(qiáng)表示,云計(jì)算與大數(shù)據(jù)研究中心雖由華東師大牽頭創(chuàng)立,但與清華大學(xué)、武漢大學(xué)、中國(guó)人民大學(xué)、中山大學(xué)、西北工業(yè)大學(xué)、東北大學(xué)、云南大學(xué)都確立了合作伙伴大學(xué)關(guān)系,將共享學(xué)術(shù)資源和專業(yè)人員進(jìn)行合作研究,同時(shí)聯(lián)合微軟、SAP、華為、上海寶信、聚勝萬(wàn)合、高德軟件等IT名企,合作進(jìn)行市場(chǎng)需求調(diào)研、聯(lián)合項(xiàng)目研究和科研成果轉(zhuǎn)化。這在全國(guó)乃至全球范圍的協(xié)同計(jì)算中邁出了實(shí)質(zhì)性的一步。
在IT科研與產(chǎn)業(yè)相結(jié)合方面,華東師大可以說(shuō)走在了全國(guó)各高校、研究機(jī)構(gòu)的前面,在“大數(shù)據(jù)時(shí)代”率先成立云計(jì)算與大數(shù)據(jù)研究中心,并秉承研以致用的理念,以產(chǎn)業(yè)鏈為紐帶,注重產(chǎn)學(xué)研的結(jié)合,實(shí)現(xiàn)伙伴大學(xué)和伙伴企業(yè)的資源共享,通過(guò)需求調(diào)研、項(xiàng)目合作和成果轉(zhuǎn)化,讓似乎遙不可及的云端技術(shù)和隱匿在傳輸介質(zhì)中不見(jiàn)其真身的數(shù)據(jù),能夠還原各自精彩,回饋于社會(huì)。
在會(huì)后的采訪中,云計(jì)算與大數(shù)據(jù)研究中心主任周傲英如數(shù)家珍地介紹了中心的研究方向——Web數(shù)據(jù)管理與挖掘、并行數(shù)據(jù)分析工具棧、內(nèi)存數(shù)據(jù)管理與分析、實(shí)時(shí)數(shù)據(jù)處理與分析、可視化分析、數(shù)據(jù)服務(wù)與安全。交流中,這位我國(guó)第一位數(shù)據(jù)庫(kù)學(xué)科的長(zhǎng)江特聘教授向記者侃侃而談:“中心具體‘業(yè)務(wù)’并非營(yíng)利性的,而是讓更多的研究伙伴參與其中,各顯其能,讓各種需求從中獲益。大數(shù)據(jù)概念本身就是一把‘傘’(Umbrella),現(xiàn)在就是把以前的很多概念放在一個(gè)概念之下。”的確,大數(shù)據(jù)研究需要多方協(xié)同創(chuàng)新,就像多個(gè)傘骨一起作用才能撐起一把大傘,華東師大撐起了這把大傘,讓傘沿所能伸及到的地方都成為了IT界學(xué)者們研討理論、共享知識(shí)的平臺(tái)。
IT科技改變?nèi)澜?mdash;—“云計(jì)算”和“大數(shù)據(jù)”,那些不得不說(shuō)的秘密
數(shù)字地理、智慧城市、MOOC(大型開(kāi)放式網(wǎng)絡(luò)課程)、自媒體……這些聽(tīng)起來(lái)既新潮又復(fù)雜的概念,引起了不少專家學(xué)者的關(guān)注甚至普通用戶的側(cè)目。實(shí)際上,這些概念的實(shí)現(xiàn)都離不開(kāi)大數(shù)據(jù)和云計(jì)算的支持。
提到“云計(jì)算”和“大數(shù)據(jù)”,大家一定不會(huì)陌生。近年來(lái),這兩個(gè)新興概念已作為技術(shù)與商業(yè)熱點(diǎn)越來(lái)越頻繁地見(jiàn)諸媒體,并逐漸為普通民眾所了解。云計(jì)算與大數(shù)據(jù)都是信息技術(shù)和網(wǎng)絡(luò)技術(shù)發(fā)展成熟的產(chǎn)物。前者通過(guò)“云”的方式提供服務(wù),將信息處理和系統(tǒng)管理從用戶的負(fù)擔(dān)轉(zhuǎn)變?yōu)橐环N基礎(chǔ)設(shè)施服務(wù),從而解放了用戶,使他們可以更專注于各自的應(yīng)用和業(yè)務(wù)。大數(shù)據(jù)則以各種信息收集手段和數(shù)據(jù)庫(kù)作為觸角,及時(shí)捕捉可用的數(shù)據(jù),通過(guò)過(guò)濾、整理、集成、分析和挖掘,為用戶提供應(yīng)用相關(guān)的知識(shí)。越來(lái)越多的傳統(tǒng)信息系統(tǒng),通過(guò)面向云計(jì)算和大數(shù)據(jù)的改造和重建,從原先封閉、割裂的狀態(tài)走向開(kāi)放與集成。同時(shí),隨著移動(dòng)終端與移動(dòng)通訊、社交網(wǎng)絡(luò)、物聯(lián)網(wǎng)等技術(shù)和應(yīng)用的發(fā)展,云計(jì)算和大數(shù)據(jù)催生了一大批新興應(yīng)用,涉及了互聯(lián)網(wǎng)和移動(dòng)廣告、社會(huì)公共管理、金融、電信、科學(xué)研究等社會(huì)、經(jīng)濟(jì)和生活的各個(gè)方面。在可預(yù)見(jiàn)的將來(lái),云計(jì)算和大數(shù)據(jù)會(huì)越來(lái)越多地在我們的日常生活以及企業(yè)、政府和各類機(jī)構(gòu)的關(guān)鍵應(yīng)用中起到支撐作用。
華東師大何積豐院士認(rèn)為,“原本概念炒得過(guò)熱的云計(jì)算、大數(shù)據(jù),應(yīng)該擺脫以往象牙塔式的樊籠,廣泛開(kāi)展國(guó)際協(xié)同,走‘頂天’、‘立地’之路,讓云計(jì)算不再飄忽不定,也讓‘數(shù)據(jù)’更好地為企業(yè)服務(wù),為國(guó)民經(jīng)濟(jì)發(fā)展‘保駕護(hù)航’。”交通運(yùn)輸、災(zāi)害處置、環(huán)境監(jiān)測(cè)、數(shù)字地理、疆域勘定等,無(wú)一都可將“新方法”應(yīng)用其中。作為新興概念和IT技術(shù)的“云計(jì)算”、“大數(shù)據(jù)”,并非空洞的科學(xué)名詞,它們所撐起的是整個(gè)網(wǎng)絡(luò)時(shí)代的人民生活,大至醫(yī)療、傳媒、地圖繪測(cè)等體系的重新構(gòu)建,小至老百姓的衣食住行——這些在不遠(yuǎn)的將來(lái)都將受其益而影響深遠(yuǎn)。
在學(xué)術(shù)研討會(huì)上,專家學(xué)者從自身研究方向出發(fā),結(jié)合中國(guó)IT技術(shù)和產(chǎn)業(yè)發(fā)展的實(shí)際情況,做出了精彩的報(bào)告。有學(xué)者側(cè)重從計(jì)算機(jī)學(xué)科領(lǐng)域內(nèi)的基礎(chǔ)研究方法和模型建構(gòu)方面,審視“云計(jì)算”和“大數(shù)據(jù)”等新問(wèn)題,令人印象深刻。如加州大學(xué)伯克利分校教授、AMPLab主任Michael J. Franklin做了《伯克利實(shí)驗(yàn)室模式:計(jì)算機(jī)科學(xué)研究的協(xié)作方法》的報(bào)告,阿里巴巴高級(jí)研究員陽(yáng)振坤在《OceanBase:一個(gè)分布式無(wú)共享關(guān)系數(shù)據(jù)庫(kù)》報(bào)告中向與會(huì)者公開(kāi)了他們開(kāi)源、分布式、無(wú)共享的結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)系統(tǒng),卡內(nèi)基-梅隆大學(xué)Lane計(jì)算生物學(xué)研究中心研究員尹俊鳴介紹了《大規(guī)模網(wǎng)絡(luò)中的混合模型建模》,宏路網(wǎng)絡(luò)科技(上海)有限公司首席技術(shù)官蔡文淵介紹了《Hypers大數(shù)據(jù)解決方案》。另外還有不少學(xué)者將抽象的學(xué)術(shù)理論與人們熟知的具體生活實(shí)例相結(jié)合,全方位地展現(xiàn)了大數(shù)據(jù)時(shí)代人們?nèi)粘I畹母鞣N可能性。
——大數(shù)據(jù)與食品安全
中國(guó)衛(wèi)星導(dǎo)航系統(tǒng)管理辦公室副主任蔡蘭波感嘆,“現(xiàn)在國(guó)內(nèi)的食品安全違法成本太低,但食品安全信息成本又過(guò)高,如果應(yīng)用云計(jì)算和大數(shù)據(jù),各方數(shù)據(jù)協(xié)同起來(lái)或許能夠改變眼下的窘?jīng)r。”
——大數(shù)據(jù)與地圖測(cè)繪
新媒體、網(wǎng)絡(luò)課程學(xué)習(xí)這些本就誕生于網(wǎng)絡(luò)時(shí)代的事物,毫無(wú)疑問(wèn)會(huì)受到“云計(jì)算”、“大數(shù)據(jù)”的影響,但誰(shuí)能想到地圖繪測(cè)這種始自人類啟蒙時(shí)代的行為也會(huì)被納入到深刻變革的行列?高德軟件首席技術(shù)官崔海就在報(bào)告《地圖和LBS位置服務(wù)與大數(shù)據(jù)暢談》中為我們釋惑。他從1570年問(wèn)世的第一張有意義的世界地圖說(shuō)起,直至400多年后的今天,雖然地圖的基本形態(tài)未變,但由GIS、CS技術(shù)賦予其新內(nèi)涵的數(shù)字地圖正在悄悄地改變著世界。隨著現(xiàn)代技術(shù)的發(fā)展以及智能手機(jī)和車載導(dǎo)航在人們生活中的普及,LBS位置服務(wù)正在經(jīng)歷二次技術(shù)革命。從傳統(tǒng)地圖數(shù)據(jù)測(cè)繪技術(shù), 到Google Street Car技術(shù),再到眾包采集, 以及從億萬(wàn)智能手機(jī)用戶獲得的UGC,大數(shù)據(jù)的獲取、處理和計(jì)算技術(shù)已經(jīng)成為地圖和LBS位置服務(wù)的核心技術(shù)。崔海認(rèn)為,大數(shù)據(jù)領(lǐng)域的新技術(shù)能在LBS服務(wù)中產(chǎn)生變革性進(jìn)步的方向。高德軟件已經(jīng)對(duì)中國(guó)公路320萬(wàn)公里的地形地貌數(shù)據(jù)采集,以每臺(tái)采集車每天行駛150-200公里計(jì),近200臺(tái)車在途,每車配備6-8個(gè)360度旋轉(zhuǎn)的拍攝頭,外加一個(gè)紅外攝影,這么海量的數(shù)據(jù)經(jīng)過(guò)傳輸、處理和分析,所產(chǎn)生的用戶體驗(yàn)甚至優(yōu)于谷歌地球(Google Earth)??梢哉f(shuō),在大數(shù)據(jù)時(shí)代,大數(shù)據(jù)技術(shù)所代表的不僅是信息的有效集合,更是一種理念,那就是“用戶需求第一”。谷歌地球已經(jīng)實(shí)現(xiàn)了令用戶足不出戶即可“暢游”全世界,高德軟件所做的,就是采集更豐富、全方位的數(shù)據(jù),令用戶體驗(yàn)到更真實(shí)、更實(shí)用的中國(guó)地圖,也讓更多的驢友放飛心情去周游,使更多的車輛安全放心奔馳。
——大數(shù)據(jù)與商務(wù)智能
企業(yè)在“大數(shù)據(jù)”的沖擊下既能獲益,也面臨著不少挑戰(zhàn)。SAP全球研究總部副總裁單名謙在《云計(jì)算與大數(shù)據(jù)的挑戰(zhàn)》報(bào)告中預(yù)言,到2014年,全球70%的1000強(qiáng)企業(yè)會(huì)將明細(xì)數(shù)據(jù)導(dǎo)入內(nèi)存,以提升商務(wù)智能應(yīng)用的性能。但問(wèn)題是我們把硬件升級(jí)、換了高端服務(wù)器就能實(shí)現(xiàn)“高性能計(jì)算”嗎?答案顯然是否定的。數(shù)據(jù)存在磁盤(pán)里,內(nèi)存和CPU對(duì)數(shù)據(jù)吞吐的瓶頸難以消除,只有新型架構(gòu)的數(shù)據(jù)庫(kù)才能支撐。SAP的HANA架構(gòu),結(jié)合了云計(jì)算和內(nèi)存計(jì)算技術(shù),成為了解決問(wèn)題的一種方式。他舉了個(gè)例子,8500萬(wàn)條數(shù)據(jù)庫(kù)記錄在2毫秒內(nèi)瞬間統(tǒng)計(jì)完成,1秒完成全部的累加計(jì)算,并由飲料業(yè)、大學(xué)、服務(wù)業(yè)等企事業(yè)提高效率千倍、萬(wàn)倍以至更多的案例來(lái)佐證新技術(shù)相比傳統(tǒng)數(shù)據(jù)庫(kù)在秒級(jí)處理、實(shí)時(shí)決策,大規(guī)模數(shù)據(jù)運(yùn)算和并行處理方面有著快速而便捷的優(yōu)勢(shì),并且低成本運(yùn)行。“未來(lái)的計(jì)算系統(tǒng)將由云計(jì)算、大數(shù)據(jù)計(jì)算、內(nèi)存計(jì)算和智能計(jì)算組成”,單名謙興奮地介紹:“我們不是把云計(jì)算和大數(shù)據(jù)兩個(gè)熱門(mén)問(wèn)題湊起來(lái),其核心是‘商業(yè)價(jià)值’,要為經(jīng)濟(jì)建設(shè)服務(wù),優(yōu)化了的數(shù)據(jù)才彰顯其價(jià)值,否則僅僅是一堆‘數(shù)據(jù)’而已,并且要有一批懂得該行業(yè)運(yùn)算規(guī)則的內(nèi)行,而不是純粹的IT人”。
——大數(shù)據(jù)與終生學(xué)習(xí)
互聯(lián)網(wǎng)數(shù)據(jù)共享、平臺(tái)式的服務(wù)同樣深刻影響了教育界?!洞髷?shù)據(jù)中的終生學(xué)習(xí)》是華為諾亞方舟實(shí)驗(yàn)室資深研究員張弓的議題,他從終生學(xué)習(xí)中人的影響、人類行為理解中的遷移學(xué)習(xí)兩方面展開(kāi)論述。張弓表示,終生學(xué)習(xí)源于教育界,由于移動(dòng)互聯(lián)網(wǎng)的發(fā)展再度急劇地加速了大數(shù)據(jù)的挑戰(zhàn),那么數(shù)據(jù)挖掘系統(tǒng)就需要有一個(gè)連續(xù)的模式來(lái)應(yīng)對(duì)持續(xù)發(fā)展的和日益增長(zhǎng)的數(shù)據(jù)流量。“區(qū)別于傳統(tǒng)的一次學(xué)習(xí)能力,我們稱之為終生機(jī)器學(xué)習(xí)”,張弓表示,“我們希望它能夠?qū)Ω恫煌膶W(xué)習(xí)任務(wù)并具備持續(xù)的學(xué)習(xí)能力。終生學(xué)習(xí)的重要基礎(chǔ)之一就是遷移學(xué)習(xí),我們希望在一個(gè)領(lǐng)域?qū)W習(xí)的知識(shí)能夠使在另一個(gè)領(lǐng)域中的學(xué)習(xí)受益。為了有效的學(xué)習(xí),維持一個(gè)持續(xù)的數(shù)據(jù)標(biāo)注能力將是一個(gè)重要的挑戰(zhàn)”。
——大數(shù)據(jù)與社交媒體
新媒體早就納入到了大數(shù)據(jù)時(shí)代的變革之中。華東師大錢衛(wèi)寧教授《社交媒體數(shù)據(jù)管理與分析:基于新浪微博的研究》,基于新浪微博近200萬(wàn)用戶3年的數(shù)據(jù)和近4000萬(wàn)用戶的關(guān)注網(wǎng)絡(luò),對(duì)玉樹(shù)地震、日本海嘯、11.15靜安大火等熱點(diǎn)事件演化規(guī)律與影響因素進(jìn)行分析,在僵尸用戶和營(yíng)銷帳號(hào)檢測(cè)等社交媒體數(shù)據(jù)分析問(wèn)題上做了大量研究,并設(shè)計(jì)了一個(gè)基于真實(shí)數(shù)據(jù)的社交媒體數(shù)據(jù)分析基準(zhǔn)測(cè)試工具。研究者還驚奇地發(fā)現(xiàn),情緒和感知有時(shí)竟然還會(huì)影響到股票指數(shù)的升降。錢衛(wèi)寧認(rèn)為,高效的社交媒體數(shù)據(jù)管理與分析對(duì)網(wǎng)上集群行為感知與分析、個(gè)性化推薦、公共輿情和情感感知與分析具有十分重要的作用。
——大數(shù)據(jù)與醫(yī)療衛(wèi)生
醫(yī)療、電力供應(yīng)等國(guó)家級(jí)的公共事業(yè)也能利用新興IT技術(shù)完善自身體系,為群眾提供更優(yōu)質(zhì)、更快捷的服務(wù)。IBM中國(guó)研究院資深研究員曹鋒講述的《醫(yī)療大數(shù)據(jù)》,表達(dá)了在翻天覆地的醫(yī)療系統(tǒng)轉(zhuǎn)型中,醫(yī)院間的協(xié)同計(jì)算應(yīng)該從一種以治療為中心的被動(dòng)模式向以預(yù)防為中心的模式轉(zhuǎn)化,并建立以患者為中心的醫(yī)療服務(wù)體系,提高藥品和醫(yī)療的安全性。他引用自己在加拿大安大略理工學(xué)院的研究成果,通過(guò)對(duì)有先天性心臟缺陷新生兒全天候監(jiān)護(hù)的海量數(shù)據(jù)分析、挖掘,讓預(yù)警提前了24小時(shí),也明顯降低了心臟早衰新生兒的死亡率;通過(guò)對(duì)紐約附近工人居住區(qū)少吃蔬菜和患肥胖癥、糖尿病人群的地圖數(shù)據(jù)分析,從中挖掘出并非他們不愿吃蔬菜,而是蔬菜超市缺乏且布局不合理,從而影響到政府出面干預(yù),提高了市民的生活質(zhì)量和健康水平的結(jié)論。曹鋒表示,醫(yī)療服務(wù)正在醫(yī)療數(shù)據(jù)往往是以結(jié)構(gòu)化非結(jié)構(gòu)化等多種形式散落在各種信息源(諸如電子病歷,電話記錄,傳感數(shù)據(jù),社會(huì)媒體)以PB的量級(jí)快速增長(zhǎng)。這些數(shù)據(jù)往往又高度敏感,受限于隱私法案而難以大量獲取。我們不乏國(guó)內(nèi)外成功的案例,但在國(guó)內(nèi)的2級(jí)城市中,簡(jiǎn)單聯(lián)網(wǎng)的醫(yī)院大有所在,連CS模式也用不上,醫(yī)療大數(shù)據(jù)之路還是一條漫漫長(zhǎng)征途。華東師大周敏奇副教授《內(nèi)存數(shù)據(jù)管理與分析》,則以智能電網(wǎng)為例,從用戶需求出發(fā),讓適合現(xiàn)有集群體系架構(gòu)的內(nèi)存數(shù)據(jù)處理系統(tǒng)框架實(shí)現(xiàn)內(nèi)存數(shù)據(jù)的容錯(cuò)性、可用性、可恢復(fù)性為其研究重點(diǎn);集群環(huán)境下的大規(guī)模并行處理資源(多節(jié)點(diǎn)、多處理器、多核、超線程等)將加速通訊墻問(wèn)題的產(chǎn)生,多粒度并發(fā)處理的控制與調(diào)度有望解決通訊墻問(wèn)題,最終實(shí)現(xiàn)實(shí)時(shí)交互式分析處理的目標(biāo)。
{{item.content}}