2015年新年伊始,國(guó)內(nèi)領(lǐng)先的Hadoop大數(shù)據(jù)平臺(tái)軟件廠商星環(huán)科技完成了新一輪數(shù)千萬(wàn)的融資。本次融資由著名風(fēng)投啟明創(chuàng)投(Qiming Venture Partners)領(lǐng)投。值得關(guān)注的是,星環(huán)科技這輪融資完成的時(shí)間僅距離上輪融資完成相隔僅5個(gè)月,公司的高成長(zhǎng)性令人矚目。
近年來(lái),我國(guó)快遞行業(yè)的規(guī)模隨著電子商務(wù)的井噴出現(xiàn)了快速的擴(kuò)張。據(jù)統(tǒng)計(jì),全國(guó)現(xiàn)在已有上百萬(wàn)快遞從業(yè)人員、十幾萬(wàn)營(yíng)業(yè)網(wǎng)點(diǎn)、幾十萬(wàn)輛快遞貨車(chē)和一年近百億件業(yè)務(wù)量。這些數(shù)字還在以每年超過(guò)40%的速率增長(zhǎng)。天文
凌晨3點(diǎn)時(shí),Arun C. Murthy被一個(gè)電話弄醒了,公司要求他緊急處理一個(gè)軟件bug。當(dāng)時(shí)他是雅虎一個(gè)的廣告定位App的工程師,App運(yùn)行很緩慢,因?yàn)锳pp啟用開(kāi)源數(shù)字平臺(tái)Hadoop時(shí)的一串軟件代碼寫(xiě)得很糟糕。誰(shuí)也不會(huì)想到,這個(gè)小bug,數(shù)年后卻促成了官方Hadoop 2.0的誕生。
越來(lái)越多的互聯(lián)網(wǎng)公司或個(gè)人開(kāi)發(fā)者嘗試通過(guò)結(jié)合地圖去做更多不一樣的事情,對(duì)于地圖數(shù)據(jù)本身也有很多有意思的事情,InfoQ借此機(jī)會(huì)采訪了Esri的盧萌,聽(tīng)他談?wù)勗贕IS數(shù)據(jù)是如何運(yùn)用Hadoop進(jìn)行并行處理的.
以往Hadoop似乎就是大數(shù)據(jù)的代名詞。不過(guò)最近隨著大數(shù)據(jù)應(yīng)用的深入,大家已經(jīng)越來(lái)越傾向于僅僅把它看成是大數(shù)據(jù)的一個(gè)存儲(chǔ)工具了。
Teradata已經(jīng)針對(duì)商業(yè)智能(BI)完善了Apache'sHadoop大數(shù)據(jù)框架,并增加了新的工具,可以更快和更簡(jiǎn)潔地查詢海量數(shù)據(jù)。
2012年11月30日-12月1日,中國(guó)IT界技術(shù)盛會(huì)——Hadoop與大數(shù)據(jù)技術(shù)大會(huì)(Hadoop&BigData Technology Conference 2012,簡(jiǎn)稱“HBTC 2012”)在北京新云南皇冠假日酒店隆重開(kāi)幕。
目前,許多企業(yè)都困惑于如何收集和分析更多類(lèi)型的多結(jié)構(gòu)化數(shù)據(jù),如網(wǎng)絡(luò)日志、無(wú)線電射頻識(shí)別(RFID)、傳感器網(wǎng)絡(luò)、社交網(wǎng)絡(luò)、互聯(lián)網(wǎng)文本和文件、互聯(lián)網(wǎng)搜索索引、詳細(xì)通話記錄、醫(yī)療記錄、攝影檔案、視頻檔案以及電子商務(wù)交易數(shù)據(jù)等。
Apache的Hadoop技術(shù)在幫助企業(yè)管理海量數(shù)據(jù)中變得越來(lái)越關(guān)鍵。包括NASA、推特和Netflix等用戶對(duì)這一開(kāi)源分布式計(jì)算平臺(tái)的依賴性越來(lái)越大。隨著越來(lái)越多的公司開(kāi)始使用Hadoop處理大數(shù)據(jù),因此我們預(yù)測(cè)Hadoop不久就會(huì)推出2.0版本。
2012地理信息開(kāi)發(fā)者大會(huì)(簡(jiǎn)稱:WGDC)在北京國(guó)家會(huì)議中心舉行,在會(huì)議第二天“Map+與開(kāi)發(fā)者訓(xùn)練營(yíng)”分會(huì)場(chǎng)上,來(lái)自《3S新聞周刊》的特約撰稿人蔣波濤博士為大家?guī)?lái)題為《PaaS平臺(tái)Hadoop在GIS數(shù)據(jù)分析中的應(yīng)用》的演講。
不管是大數(shù)據(jù)或是海量數(shù)據(jù),都指向一個(gè)共同的趨勢(shì),就是數(shù)據(jù)增長(zhǎng)的速度越來(lái)越快,而之所以能構(gòu)成Big Data這個(gè)新議題,就在于數(shù)據(jù)量之大已不同之前,目前的技術(shù)已經(jīng)難以處理。
Apache的Hadoop是十年來(lái)令人最興奮的開(kāi)源項(xiàng)目,如今已經(jīng)發(fā)布了1.0版本。這是一個(gè)不小的里程碑。開(kāi)源云計(jì)算架構(gòu)隨著雅虎和谷歌創(chuàng)建的技術(shù)而開(kāi)始,現(xiàn)在用于各大企業(yè),包括亞馬遜、蘋(píng)果、臉譜、微軟、Netflix LinkedIn和 Twitter,已經(jīng)立足于市場(chǎng)六年之久。
R現(xiàn)在還可以運(yùn)行在HBase這種非關(guān)系型的數(shù)據(jù)庫(kù)以及面向列的分布式數(shù)據(jù)存儲(chǔ)之上。其主要模仿了Google的BigTable。這基本上等同于使用Hadoop來(lái)持有結(jié)構(gòu)化數(shù)據(jù)的數(shù)據(jù)庫(kù)。就像Apache軟件基金會(huì)Hadoop項(xiàng)目的子項(xiàng)目HBase一樣。