大數(shù)據(jù)平臺是從各種類型的、漫無邊際的數(shù)據(jù)中,快速獲得有價值信息的處理方法或框架。大數(shù)據(jù)中的“大”不是大數(shù)據(jù)的唯一指標(biāo),而是更強調(diào)數(shù)據(jù)的類型多樣、處理的速度和獲取價值的能力。分析人士表示,大數(shù)據(jù)對傳統(tǒng)行業(yè)的重構(gòu)有望成為中國經(jīng)濟新一輪快速發(fā)展的關(guān)鍵推動力,對于A股上市公司而言,IT業(yè)、移動互聯(lián)網(wǎng)、交運和電力安全設(shè)備生產(chǎn)商等四類板塊受益明顯。
網(wǎng)絡(luò)是大數(shù)據(jù)重要信源
數(shù)據(jù)是平臺運營商的重要資產(chǎn),可能提供API接口允許第三方有限度地使用,但是顯然是為了增強自身的業(yè)務(wù),與此目的抵觸的行為都會受到約束,同時,也是大數(shù)據(jù)應(yīng)用的基礎(chǔ)和前提。
收集數(shù)據(jù)主要是通過計算機和網(wǎng)絡(luò)。凡是經(jīng)過計算機處理的數(shù)據(jù)都很容易收集,比如瀏覽器里的搜索、點擊、網(wǎng)上購物、其他數(shù)據(jù)(比如氣溫、海水鹽度、地震波)可以通過傳感器轉(zhuǎn)化成數(shù)字信號輸入計算機。
收集到的數(shù)據(jù)一般要先經(jīng)過整理,常用的軟件如Tableau和Impure是功能比較全面的,Refine和Wrangler是比較純粹的數(shù)據(jù)整理工具,Weka用于數(shù)據(jù)挖掘。Hadoop是一個能夠?qū)Υ罅繑?shù)據(jù)進行分布式處理的軟件框架。用于統(tǒng)計分析的R語言有個擴展R+Hadoop,可以在Hadoop集群上運行R代碼。還有很多可以用來在網(wǎng)頁上實現(xiàn)可視化輸出的框架或者控件。大致基于四種技術(shù):Flash(Flex)或者JS(HTML5)或者Java或者ASP.NET(Silverlight)。
大數(shù)據(jù)帶給四行業(yè)新機遇
進入大數(shù)據(jù)時代,都有哪些A股公司存在投資新機遇呢?分析人士認為,大數(shù)據(jù)時代主要有四類行業(yè)明顯受益。首先,受益最明顯的當(dāng)屬IT業(yè)。數(shù)據(jù)顯示,2012年大數(shù)據(jù)對全球IT開支的直接或間接推動達960億美元,而到2016年,這一數(shù)字預(yù)計將達到2320億美元。據(jù)國內(nèi)有關(guān)機構(gòu)初步預(yù)算,未來中國大數(shù)據(jù)潛在市場規(guī)模有望近2萬億元,將給IT行業(yè)開拓了一個新的黃金時代。
其次,移動互聯(lián)網(wǎng)行業(yè)。以騰訊、阿里巴巴、百度、奇虎360等為代表的互聯(lián)網(wǎng)公司目前已經(jīng)形成了與傳統(tǒng)電信運營商價值鏈重新劃分的格局,使得運營商的角色正在不知不覺中發(fā)生著變化。
第三,交通運輸業(yè)。隨著城市的迅速發(fā)展,交通擁堵、交通污染日益嚴重,交通事故頻繁發(fā)生,這些都是各大城市亟待解決的問題。智能交通成為改善城市交通的關(guān)鍵所在。為此,及時、準(zhǔn)確獲取交通數(shù)據(jù)并構(gòu)建交通數(shù)據(jù)處理模型是建設(shè)智能交通的前提,而這一難題可以通過大數(shù)據(jù)技術(shù)得到解決。無論是交通基礎(chǔ)設(shè)施、交通運行狀態(tài)還是交通服務(wù)對象和交通運載工具,每時每刻都在產(chǎn)生著大量的數(shù)據(jù),以大數(shù)據(jù)的思路和角度來看,這些都是正待挖掘的寶藏,能為交通決策和服務(wù)帶來新的解題思路。
第四、電力信息安全設(shè)備生產(chǎn)商。近日,電力行業(yè)信息安全類“招標(biāo)競賽”正在火熱上演,全國多家電網(wǎng)公司相繼在信息安全設(shè)備采購招標(biāo)項目上亮出大手筆投資,采購內(nèi)容涉及數(shù)據(jù)丟失防護、數(shù)據(jù)恢復(fù)、數(shù)據(jù)清除等眾多軟硬件產(chǎn)品,部分采購項目甚至達到上億元的規(guī)模,新一輪大規(guī)模電力系統(tǒng)信息安全建設(shè)浪潮撲面而來。
風(fēng)投青睞大數(shù)據(jù)創(chuàng)業(yè)公司 新興市場藍海正待發(fā)掘
■本報記者 孔瑞敏
“世界的本質(zhì)是數(shù)據(jù)“,大數(shù)據(jù)時代的預(yù)言家維克托·邁爾-舍恩伯格此話擲地有聲。然而置身于在大數(shù)據(jù)的浩瀚海洋中,我們不得不承認這樣一個事實,人類的技術(shù)水平目前還沒有達到隨心所欲地處理一切數(shù)據(jù)的地步。
清華大學(xué)蘇州研究院大數(shù)據(jù)處理中心技術(shù)總監(jiān)趙勇,同時也是聚云浩海(蘇州)信息科技有限公司的技術(shù)總監(jiān)則直言,在信息處理技術(shù)的步伐沒有跟上之前,每日都在激增的大數(shù)據(jù)帶來的是問題,而不是能夠產(chǎn)生價值的資源。趙勇在他即將出版的新書《架構(gòu)大數(shù)據(jù)-大數(shù)據(jù)技術(shù)解析 》中寫道:“傳統(tǒng)的信息技術(shù)架構(gòu),已無法處理大數(shù)據(jù)問題,需要以現(xiàn)代云計算的手段和技術(shù)來解決大數(shù)據(jù)問題。”無可辯駁,大數(shù)據(jù)要為我所用,處理分析數(shù)據(jù)的需求也催生了一批創(chuàng)業(yè)公司,風(fēng)投資本的青睞助推了其雨后春筍般的成長速度。
《證券日報》:為什么說大數(shù)據(jù)的爆發(fā)是信息發(fā)展過程中遇到的棘手問題?大數(shù)據(jù)平臺的搭建又有什么意義?
趙勇:信息技術(shù)為人類步入智能社會開啟了大門,帶動了互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、電子商務(wù)、現(xiàn)代物流、網(wǎng)絡(luò)金融等現(xiàn)代服務(wù)業(yè)發(fā)展,催生了車聯(lián)網(wǎng)、智能電網(wǎng)、新能源、智能交通、智能城市、高端裝備制造等新興產(chǎn)業(yè)發(fā)展。現(xiàn)代信息技術(shù)正成為各行各業(yè)運營和發(fā)展的引擎。但這個引擎正面臨著大數(shù)據(jù)這個巨大的考驗。各種業(yè)務(wù)數(shù)據(jù)正以幾何級數(shù)的形式爆發(fā),其格式、收集、儲存、檢索、分析、應(yīng)用等諸多問題,不再能以傳統(tǒng)的信息處理技術(shù)加以解決,對人類實現(xiàn)數(shù)字社會、網(wǎng)絡(luò)社會和智能社會帶來了極大的障礙。在實踐中,一些地方政府和企事業(yè)單位一般會將采集到的數(shù)據(jù)選取一段時間內(nèi)的或者異常的數(shù)據(jù)進行部分存儲,或者干脆不存儲。
大數(shù)據(jù)爆發(fā)帶來的瓶頸需要以現(xiàn)代云計算的手段和技術(shù)來解決。云計算與大數(shù)據(jù)是相輔相成、辨證統(tǒng)一的關(guān)系,云計算、物聯(lián)網(wǎng)技術(shù)的廣泛應(yīng)用是我們的愿景,而大數(shù)據(jù)的爆發(fā)則是發(fā)展中遇到的棘手問題。大數(shù)據(jù)技術(shù)的突破不僅能解決現(xiàn)實困難,同時也會促使云計算、物聯(lián)網(wǎng)技術(shù)真正落地并深入推廣和應(yīng)用。
由于云計算并沒有真正落地,現(xiàn)在在各個行業(yè)、各個機構(gòu)之間形成了很多信息孤島。國內(nèi)有不少側(cè)重于大數(shù)據(jù)應(yīng)用的公司,但是從事基礎(chǔ)層面的數(shù)據(jù)采集、存儲、計算、分析和展示業(yè)務(wù)的公司較少,如果僅僅從應(yīng)用層面來做的話,基礎(chǔ)數(shù)據(jù)很難實現(xiàn)互通互聯(lián),這就需要一些平臺型的架構(gòu)將數(shù)據(jù)關(guān)聯(lián)起來。比如要建設(shè)智慧城市,就必須跨部門、跨行業(yè)進行數(shù)據(jù)共享交互,這就需要從大數(shù)據(jù)平臺和接口入手。 平臺搭建好之后,再選擇性地做應(yīng)用。
《證券日報》:大數(shù)據(jù)時代數(shù)據(jù)的多維價值正在被逐步發(fā)現(xiàn),整個市場的規(guī)模將會無法想象。
趙勇:是的,2012年被稱為大數(shù)據(jù)元年,今年大數(shù)據(jù)市場正處在井噴式發(fā)展階段,未來五年全球大數(shù)據(jù)市場價值將高達幾百億美元。2012年初,大數(shù)據(jù)相關(guān)軟件、硬件和服務(wù)的收入總和只有約50億美元。但隨著企業(yè)對大數(shù)據(jù)價值的認識和相關(guān)產(chǎn)品技術(shù)及應(yīng)用模式的不斷成熟,大數(shù)據(jù)相關(guān)產(chǎn)業(yè)和服務(wù)將獲得長足發(fā)展,大數(shù)據(jù)將逐漸落地,并在未來幾年保持驚人的增長速度。國內(nèi)因為傳統(tǒng)的信息手段和技術(shù)都迫切需要轉(zhuǎn)型升級,大數(shù)據(jù)市場實際上就是云計算在各個領(lǐng)域和行業(yè)的應(yīng)用市場,所以綜合市場規(guī)模在最近幾年將達千億元量級。
《證券日報》:國內(nèi)外通過搭建數(shù)據(jù)平臺來發(fā)掘經(jīng)濟價值的公司是怎樣的情況?
趙勇:國內(nèi)此類的創(chuàng)業(yè)公司還正在起步,國外已經(jīng)有一些運行良好的做數(shù)據(jù)服務(wù)業(yè)務(wù)的公司了。比如位于西雅圖的BlueKai,它建立了一個數(shù)據(jù)管理平臺(DMP),用來幫助用戶組織并分析數(shù)據(jù),同時也建立了數(shù)據(jù)交換中心,連通數(shù)據(jù)需求的兩端。
《證券日報》:資本的嗅覺總是十分靈敏,一切能產(chǎn)生價值的地方總能看到資本的身影。請簡要介紹一下國內(nèi)外大數(shù)據(jù)領(lǐng)域的創(chuàng)業(yè)型公司及風(fēng)險投資的動向?
趙勇:大數(shù)據(jù)概念的普及,也帶動了資本市場對大數(shù)據(jù)技術(shù)創(chuàng)業(yè)公司的高度關(guān)注,國外多家頂級風(fēng)投和早期投資機構(gòu)都對大數(shù)據(jù)行業(yè)青睞有加。
另一方面,大數(shù)據(jù)問題出來之后,國際互聯(lián)網(wǎng)行業(yè)巨頭得益于人財物的優(yōu)勢,可以快速提供解決方案,但由于他們所運用的還是傳統(tǒng)產(chǎn)品,目前還沒有殺手锏級別的新產(chǎn)品出來,也也給大數(shù)據(jù)創(chuàng)業(yè)公司提供了機會。可以說從數(shù)據(jù)的采集、存儲、分析,直到最上層的數(shù)據(jù)展示,每一個層面都有可供大數(shù)據(jù)創(chuàng)業(yè)公司發(fā)掘的機會,也為資本提供了很好的投資標(biāo)的。
例如,風(fēng)投機構(gòu)Accel Partners針對這一行業(yè)設(shè)立了一支總額高達1億美元的基金;大數(shù)據(jù)分析公司Splunk,在Nasdaq首日IPO即上漲109%;其他大數(shù)據(jù)軟件服務(wù)商如MapR、10Gen、DataStax等近期都完成了千萬美元級的融資。
在國內(nèi),互聯(lián)網(wǎng)行業(yè)“去IOE”的呼聲漸高(IOE分別是IBM、Oracle、EMC,更確切地說是IBM小型機、Oracle數(shù)據(jù)庫與EMC存儲設(shè)備的組合,這三駕馬車構(gòu)成了一個從軟件到硬件的完整商用數(shù)據(jù)庫系統(tǒng)),很多大數(shù)據(jù)創(chuàng)業(yè)公司躍躍欲試,涌現(xiàn)了一批大數(shù)據(jù)分析、挖掘、展示、廣告方面的創(chuàng)業(yè)公司。我們清華大數(shù)據(jù)處理中心在成立前期就是在四家感興趣的風(fēng)投公司中選擇的一家,近期我們又在智慧教育、智慧旅游、車聯(lián)網(wǎng)等方面發(fā)力,正在吸引新一輪融資。以云計算和大數(shù)據(jù)為引領(lǐng)的新一代信息技術(shù)在各個領(lǐng)域都能帶來模式、內(nèi)容、路徑方面的創(chuàng)新,會形成諸多新興市場的藍海。
百度騰訊等中概股 凸顯大數(shù)據(jù)平臺價值
■本報見習(xí)記者 喬川川
大數(shù)據(jù)的快速發(fā)展與物聯(lián)網(wǎng)、傳統(tǒng)互聯(lián)網(wǎng)及移動互聯(lián)網(wǎng)三大平臺與日俱增的海量數(shù)據(jù)密不可分。新一波大數(shù)據(jù)革命浪潮已經(jīng)來臨,然而能分享“智慧盛宴”的公司鳳毛麟角。在中國,業(yè)界普遍認為騰訊、百度和阿里巴巴三大互聯(lián)網(wǎng)龍頭公司已經(jīng)成為大數(shù)據(jù)平臺建設(shè)和發(fā)展的領(lǐng)頭羊。
目前,百度、騰訊均已上市,據(jù)媒體報道,阿里巴巴正籌劃赴香港上市。
百度于2005年8月5日登錄納斯達克上市,發(fā)行價格為每股27美元。截至8月27日收盤,百度股價年內(nèi)累計漲幅為34.73%,公司最新股價為每股135.12美元。
百度在大數(shù)據(jù)時代扮演的不僅是流量及資源共享的平臺角色,公司更好地利用其大數(shù)據(jù)平臺與其它電商企業(yè)進行合作創(chuàng)造了新的利潤增長點;百度云平臺提供的BAE(百度應(yīng)用引擎)將提供高并發(fā)的處理能力,滿足處理速度快的要求。不僅如此,百度移動客戶端統(tǒng)計、移動搜索數(shù)據(jù)分析及移動調(diào)研報告等分析,能夠為開發(fā)者提供強大的統(tǒng)計分析服務(wù),讓開發(fā)決策更加有據(jù)可依。
百度云技術(shù)品牌總監(jiān)陳尚義先生表示,百度作為國內(nèi)領(lǐng)先的互聯(lián)網(wǎng)搜索商,在擴展搜索、突發(fā)訪問搜索、百度指數(shù)上都充分利用了大數(shù)據(jù)。例如:在百度指數(shù)中輸入當(dāng)前最熱門詞匯之一手游,便可查到通過百度搜索手游關(guān)鍵詞的客戶年齡分布、性別、所在地域等多個特征,這其中的商業(yè)價值便隨之而來,作為手游開發(fā)商如果充分利用這些特征,對于手游產(chǎn)品開發(fā)的針對性、地域推廣的區(qū)別性便有了可參考指標(biāo)。
除百度外,騰訊是在大數(shù)據(jù)時代下,公認的最具有商業(yè)價值的一家互聯(lián)網(wǎng)平臺上市公司。公司于2004年6月16日在中國香港上市,發(fā)行價格為每股3.7港元,截至8月27日,公司的最新收盤價為每股362.00港元,年內(nèi)累計漲幅45.38%。相對于阿里巴巴、百度等互聯(lián)網(wǎng)公司,騰訊的產(chǎn)品線更豐富、廣泛,從門戶網(wǎng)站到微博、視頻、電子商務(wù)、開放平臺等有多個跨平臺領(lǐng)域。因此,騰訊更加充分、完整地記錄了人們在互聯(lián)網(wǎng)上的行為軌跡和社會屬性。當(dāng)用戶在互聯(lián)網(wǎng)上留下自己的行為軌跡并生成大量數(shù)據(jù)時,可挖掘的商業(yè)價值也較高。
業(yè)內(nèi)人士表示,在中國,騰訊是最具類似“Facebook+Twitter”大數(shù)據(jù)基因的互聯(lián)網(wǎng)公司,作為大數(shù)據(jù)平臺的龍頭公司,用戶可以在騰訊空間平臺上分享日志、照片,微博,又有不同的線索可對人群進行劃分,這些都產(chǎn)生了海量的有價值數(shù)據(jù),這些強關(guān)系鏈和弱關(guān)系鏈的組合,能讓廣告客戶更加精準(zhǔn)得將廣告信息推送給目標(biāo)人群。
除上述三家領(lǐng)頭平臺公司外,目前上市的中概股大數(shù)據(jù)平臺上市公司還有網(wǎng)易,新浪,搜狐。網(wǎng)易于2000年6月30日在納斯達克上市,截至8月27日,公司最新收盤價為每股73.36美元,年內(nèi)累計漲幅72.49%;新浪于2000年4月13日在納斯達克上市,截至8月27日,公司最新收盤價為每股76.75美元,年內(nèi)累計漲幅52.83%;搜狐于2000年7月12日在納斯達克上市,截至8月27日,公司最新收盤價為每股60.61美元,年內(nèi)累計漲幅28.03%。
網(wǎng)易、新浪、搜狐有望成為大數(shù)據(jù)平臺類上市公司中的第二梯隊,在這三家公司中,新浪的大數(shù)據(jù)運用處于領(lǐng)先地位。去年年底,新浪微博啟動信息流廣告測試,根據(jù)興趣愛好和社交關(guān)系向網(wǎng)友推薦相關(guān)信息;今年4月份,新浪微博宣布與阿里進行戰(zhàn)略合作,明確表示將在大數(shù)據(jù)業(yè)務(wù)層面展開持續(xù)深入的合作探索;5月份,手機客戶端附件功能的加入以及Page頁面的發(fā)布,是新浪微博推進大數(shù)據(jù)戰(zhàn)略的又一重要舉措。