網(wǎng)、電信、金融等行業(yè)企業(yè)無疑在數(shù)據(jù)服務(wù)業(yè)務(wù)方面還有很大的開拓空間。
社會(huì)化數(shù)據(jù)的迅猛增長(zhǎng)除了讓掌握了這些數(shù)據(jù)的企業(yè)順勢(shì)推出了相關(guān)的數(shù)據(jù)服務(wù)之外,也直接影響到了數(shù)據(jù)分析技術(shù)提供商們的發(fā)展戰(zhàn)略。
2010年10月,一直專注于商業(yè)智能技術(shù)的美國(guó)公司Teradata就宣布推出新的社交媒體平臺(tái),專門進(jìn)行與挖掘社會(huì)化數(shù)據(jù)相關(guān)的信息分享。在面向企業(yè)推出的產(chǎn)品上,則在其主打的數(shù)據(jù)倉庫產(chǎn)品之外,加入了關(guān)鍵的社會(huì)化數(shù)據(jù)的抓取和分析功能技術(shù)Hadoop。
“Teradata的傳統(tǒng)優(yōu)勢(shì)在于可以應(yīng)對(duì)數(shù)據(jù)庫內(nèi)的海量數(shù)據(jù),Hadoop技術(shù)則可以處理來自互聯(lián)網(wǎng)的大規(guī)模數(shù)據(jù),現(xiàn)在我們將原有產(chǎn)品和Hadoop技術(shù)整合到一起,可以更好地解決企業(yè)的數(shù)據(jù)處理問題?!?Teradata公司首席技術(shù)官Stephen Brobst說。

Teradata CTO寶立明
對(duì)很多人來講,Hadoop這樣一個(gè)名詞可能還比較陌生,但實(shí)際上,從Yahoo的 Web搜索研究,到Facebook的數(shù)據(jù)分析,再到百度的搜索日志分析、淘寶的數(shù)據(jù)魔方服務(wù),以及中移動(dòng)推出了 “大云”(BigCloud)系統(tǒng),Hadoop的身影都已經(jīng)到處閃現(xiàn)。簡(jiǎn)單來講,社會(huì)化數(shù)據(jù)時(shí)代的企業(yè)需要像八爪魚一樣,能夠發(fā)現(xiàn)并拿到他需要的數(shù)據(jù),而Hadoop技術(shù)的好處就是,不但可以方便地嵌入到各種實(shí)際應(yīng)用中以實(shí)現(xiàn)全文搜索/索引,而且可以進(jìn)行數(shù)據(jù)抓取。比如雅虎,通過應(yīng)用這一技術(shù),幾乎可以實(shí)時(shí)分析每一個(gè)頁面點(diǎn)擊并優(yōu)化內(nèi)容的排名,每7分鐘就能更新一次結(jié)果。
數(shù)據(jù)無盡頭
如果說社會(huì)化數(shù)據(jù)相對(duì)于企業(yè)內(nèi)部的那些結(jié)構(gòu)化數(shù)據(jù)來講算新數(shù)據(jù)的話,那么,類似的新數(shù)據(jù)在未來還將不斷增加。
因?yàn)橐苿?dòng)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等新網(wǎng)絡(luò)的發(fā)展還在繼續(xù),未來新的數(shù)據(jù)源將會(huì)不斷地出現(xiàn),由此,像GPS數(shù)據(jù)、移動(dòng)數(shù)據(jù)、傳感器收集的數(shù)據(jù)也將會(huì)不停地、大量的產(chǎn)生。
對(duì)于企業(yè)的整體數(shù)據(jù)生態(tài)系統(tǒng)來講,其實(shí)可以依據(jù)私有云和公有云的界定將其所有數(shù)據(jù)分成兩大部分。對(duì)于私有云,更多地體現(xiàn)為企業(yè)內(nèi)部的傳統(tǒng)結(jié)構(gòu)化數(shù)據(jù),在未來的三到五年內(nèi),很多企業(yè)都將會(huì)大力發(fā)展其內(nèi)部的云計(jì)算環(huán)境,像IBM、EMC等公司可以憑借虛擬化技術(shù)、硬件存儲(chǔ)功能為客戶提供相關(guān)的數(shù)據(jù)處理方案。
而對(duì)于更為廣闊的公有云數(shù)據(jù),帶來的市場(chǎng)空間同樣很大?!半S著社會(huì)化數(shù)據(jù)、非結(jié)構(gòu)數(shù)據(jù)、大數(shù)據(jù)的產(chǎn)生,企業(yè)需要將這些數(shù)據(jù)集中起來,加以分析利用,這也將會(huì)給Teradata這樣的公司帶來巨大的機(jī)會(huì)。”Teradata大中華區(qū)總裁辛兒倫(Aaron Hsin)在采訪中如此表示。
比如在能源領(lǐng)域,Teradata就與智能電表供應(yīng)商Itron公司打造了一個(gè)軟件分析平臺(tái),對(duì)使用的數(shù)據(jù)進(jìn)行分析,解決了能源一旦生產(chǎn)出來無法儲(chǔ)存和節(jié)約的問題。憑借該分析平臺(tái),公用事業(yè)企業(yè)能夠根據(jù)預(yù)測(cè)使用量和實(shí)際使用量對(duì)能源進(jìn)行分配。比如,在住宅區(qū)域和制造業(yè)密布的區(qū)域,電力將采用不同的分配規(guī)劃。這一服務(wù)平臺(tái)不僅可讓能源企業(yè)獲得能源使用量、虛假信息和能源分配方面的數(shù)據(jù),還能根據(jù)每個(gè)企業(yè)在每天特定時(shí)間的使用量進(jìn)行定價(jià)和收費(fèi),并且更合理地配置能源。
此外,未來對(duì)地理空間數(shù)據(jù)的應(yīng)用也是熱點(diǎn)之一。比如零售企業(yè)將地理空間數(shù)據(jù)與其網(wǎng)點(diǎn)、客戶數(shù)據(jù)相結(jié)合之后,即可針對(duì)其競(jìng)爭(zhēng)對(duì)手推出更具競(jìng)爭(zhēng)力的布局和促銷活動(dòng)。而汽車保險(xiǎn)行業(yè)則可以用感應(yīng)器來收集數(shù)據(jù)。通過收集車輛行駛過程中的信息,與公路網(wǎng)的地理空間數(shù)據(jù)重疊起來,就可以對(duì)路況不好,經(jīng)常發(fā)生事故的道路進(jìn)行分析和防范。據(jù)辛兒倫介紹,目前,國(guó)內(nèi)已經(jīng)有部分客戶采用了Teradata的地理空間數(shù)據(jù)解決方案,主要分布在零售業(yè)、保險(xiǎn)業(yè)和政府機(jī)關(guān)三個(gè)領(lǐng)域。