由陜西省西咸新區(qū)管委會主辦,灃西新城管委會承辦,賽迪顧問等公司協(xié)辦的“2014西咸新區(qū)大數(shù)據(jù)高峰論壇”近日在西安召開。“西咸新區(qū)在國內(nèi)率先‘舉旗大數(shù)據(jù)’,目前已初步健全產(chǎn)業(yè)鏈,產(chǎn)業(yè)集聚發(fā)展成效顯著,信息絲綢之路初見端倪。陜西將繼續(xù)著力構(gòu)建大數(shù)據(jù)創(chuàng)新體系,搭建產(chǎn)業(yè)基礎(chǔ)平臺,探索科學(xué)發(fā)展模式,提升技術(shù)服務(wù)水平,積極推進大數(shù)據(jù)規(guī)范化發(fā)展。”陜西省委常委、常務(wù)副省長、西咸新區(qū)管委會主任江澤林在論壇上的這番話體現(xiàn)了陜西發(fā)展大數(shù)據(jù)產(chǎn)業(yè)的決心和信心。
其實,除了陜西,全國很多省市均將大數(shù)據(jù)產(chǎn)業(yè)提到了區(qū)域發(fā)展戰(zhàn)略高度。對此,很多媒體用“火熱”來形容中國當下的大數(shù)據(jù)產(chǎn)業(yè)。“越是炒得火熱,越是要思路清晰!”中國科學(xué)院院士徐宗本在論壇期間接受記者采訪時這樣評價道,而這種觀點也是業(yè)內(nèi)有識之士的共識。
產(chǎn)業(yè)門檻高
眾所周知,大數(shù)據(jù)具有4V特點,即Volume(大量)、Variety(多樣)、Velocity(高速)和Value(價值),其價值在業(yè)界越來越得到重視。世紀互聯(lián)云事業(yè)部總裁柯文達認為,具有4V特點的大數(shù)據(jù)會產(chǎn)生一些令人意想不到的“化學(xué)反應(yīng)”。“人類在學(xué)習(xí)的過程中,大部分的思考方式其實是線性方式,而大數(shù)據(jù)和云計算則提供了一個非線性的思考方式,可以把各個不同的領(lǐng)悟,各個不相關(guān)的東西組合起來成為一種有價值的決策。”柯文達表示。可以說,大數(shù)據(jù)技術(shù)讓看似分文不值的“閑散”數(shù)據(jù)變得有價值,數(shù)據(jù)和石油一樣變成了一種“資源”。
但是和其他產(chǎn)業(yè)不同,大數(shù)據(jù)產(chǎn)業(yè)門檻更高。徐宗本認為其原因有兩方面:一方面,大數(shù)據(jù)要做的事是將無形的、雜亂無章的數(shù)據(jù)進行真正顯化,因此要有很高程度的科技儲備。另一方面,對于其他產(chǎn)業(yè),技術(shù)相對成熟,只是需要將技術(shù)產(chǎn)業(yè)化。而大數(shù)據(jù)產(chǎn)業(yè)并不是技術(shù)已經(jīng)成熟的產(chǎn)業(yè),甚至可以說科學(xué)基礎(chǔ)都還沒有成型,但技術(shù)變化又如此之快,需要將基礎(chǔ)研究、技術(shù)研究和產(chǎn)業(yè)化融為一體。因此,發(fā)展大數(shù)據(jù)產(chǎn)業(yè),產(chǎn)學(xué)研一定要有效結(jié)合。
據(jù)介紹,大數(shù)據(jù)產(chǎn)業(yè)擁有一條從數(shù)據(jù)到價值的產(chǎn)業(yè)鏈,涵蓋4大部分:一是數(shù)據(jù)獲取與管理,二是數(shù)據(jù)存儲與處理,三是數(shù)據(jù)分析與理解,四是結(jié)合具體領(lǐng)域的大數(shù)據(jù)應(yīng)用。“高度多學(xué)科綜合性是大數(shù)據(jù)研究的特點。”徐宗本強調(diào)。例如,數(shù)據(jù)獲取與管理涉及管理、物理、電子與信息等學(xué)科;數(shù)據(jù)存儲與處理涉及計算機科學(xué);數(shù)據(jù)分析與理解數(shù)據(jù)數(shù)學(xué)與統(tǒng)計學(xué);大數(shù)據(jù)應(yīng)用則與各行各業(yè)相關(guān)學(xué)科關(guān)聯(lián)。
那么,對于產(chǎn)業(yè)門檻高、具有多學(xué)科綜合性的大數(shù)據(jù),中國的技術(shù)研究是否落后于國外呢?徐宗本并不這樣認為。
“任何科學(xué)研究都不是割裂的,現(xiàn)在所說的大數(shù)據(jù)科學(xué)研究,其實就是過去的統(tǒng)計學(xué)、計算數(shù)學(xué)、人工智能、數(shù)據(jù)挖掘等幾個領(lǐng)域的延續(xù)。中國的研究和國際的研究,應(yīng)該說處于同一起跑線上,發(fā)展基本是同步的。”徐宗本表示,“而且中國發(fā)展大數(shù)據(jù)產(chǎn)業(yè)有兩大優(yōu)勢:第一,中國有體制優(yōu)勢,能夠集中精力做大事,政府行政執(zhí)行力強,這對大數(shù)據(jù)產(chǎn)業(yè)而言很重要,比如在數(shù)據(jù)共享方面,需要打破行業(yè)壟斷,政府的決心起到關(guān)鍵作用。第二,大數(shù)據(jù)的物質(zhì)基礎(chǔ)是以互聯(lián)網(wǎng)為載體的,而在互聯(lián)網(wǎng)技術(shù)的應(yīng)用上,中國是全球領(lǐng)先的。”
徐宗本強調(diào),正是因為大數(shù)據(jù)產(chǎn)業(yè)門檻高,所以大家需要理性對待大數(shù)據(jù),大數(shù)據(jù)蘊含著大機會,但需要認真選擇目標、選準方向,要有技術(shù)儲備,還要解決好人才培養(yǎng)問題。
構(gòu)建超巨系統(tǒng)時不我待
“大數(shù)據(jù)是怎么來的?不是天上掉下來的,正是多年來信息化不斷發(fā)展的結(jié)果。信息化的過程就是數(shù)據(jù)資源開發(fā)的過程。”國家信息化專家咨詢委員會常務(wù)副主任周宏仁在會上談到了大數(shù)據(jù)的本質(zhì)。政府部門和企事業(yè)單位都利用互聯(lián)網(wǎng)將自己的信息系統(tǒng)向部門或企事業(yè)的關(guān)聯(lián)單位延伸,信息系統(tǒng)逐漸向大系統(tǒng)發(fā)展。
不過,周宏仁認為,隨著互聯(lián)網(wǎng)用戶的急劇增加,各種基于互聯(lián)網(wǎng)的應(yīng)用系統(tǒng),特別是電子商務(wù)和社交網(wǎng)絡(luò)的急劇發(fā)展;物聯(lián)網(wǎng)的快速興起;以及數(shù)據(jù)終端種類和數(shù)量的急劇增加;移動互聯(lián)網(wǎng)的快速發(fā)展等促使數(shù)據(jù)量出現(xiàn)了新的增長,也催生了超巨型信息系統(tǒng)(超巨系統(tǒng))。所有這些看似并無關(guān)聯(lián)的、數(shù)以千計、大大小小的信息系統(tǒng)中所包含的數(shù)據(jù),需要另辟蹊徑,另構(gòu)系統(tǒng),開發(fā)和利用這一類超大型的數(shù)據(jù)資源。
超巨系統(tǒng)與大系統(tǒng)的主要區(qū)別在于,它們是為了完成特定功能設(shè)計的,而實現(xiàn)其功能所基于的各種成員系統(tǒng),無論在功能、運行、管理和地域上都是無關(guān)的,也不具有任何先驗的、人為設(shè)計的特征。不僅如此,其成員系統(tǒng)可能是隨機的、泛在的、動態(tài)遷移的。移動互聯(lián)網(wǎng)、物聯(lián)網(wǎng)和智能終端的發(fā)展,使成員系統(tǒng)的泛在化特征大為增強。這類超巨系統(tǒng)充分利用全球現(xiàn)有的各種信息系統(tǒng)的功能和數(shù)據(jù)特征而構(gòu)造,目的就是為了構(gòu)造目的性極強的超大數(shù)據(jù)平臺,從而獲取、分析和利用所獲取的大數(shù)據(jù),最終獲取情報或信息。
例如,美國國安局每天收集全球各地近50億條手機通信記錄,并對其位置和活動進行跟蹤,這個全球監(jiān)聽系統(tǒng)就是一個典型的超巨系統(tǒng)。顯然,這個超巨系統(tǒng)的是需要精心設(shè)計的,需要設(shè)定系統(tǒng)目標、功能、體系結(jié)構(gòu)、數(shù)據(jù)源、數(shù)據(jù)采集方法和分析利用、系統(tǒng)運行維護等。這個系統(tǒng)的數(shù)據(jù)結(jié)構(gòu)可能是多種多樣的,如結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化,即使同為結(jié)構(gòu)化,數(shù)據(jù)結(jié)構(gòu)可能也完全不同。因此,超巨信息系統(tǒng)的設(shè)計和構(gòu)建理論完全不同于傳統(tǒng)意義上的信息系統(tǒng)一般理論,需要新的信息系統(tǒng)方法學(xué)做支撐。
從信息系統(tǒng)的角度看,至少存在兩種不同形態(tài)的大數(shù)據(jù):從大系統(tǒng)中獲得的大數(shù)據(jù)和從超巨系統(tǒng)中獲得的大數(shù)據(jù)。前者可由政府、企事業(yè)單位在其信息化的進程中“水到渠成”地解決,后者則需要根據(jù)目標和功能,通過構(gòu)造特定的超巨系統(tǒng)來解決。
對于許多真正的跨企業(yè)、跨行業(yè)、跨部門、跨地域的大數(shù)據(jù)分析利用而言,沒有超巨系統(tǒng)就沒有大數(shù)據(jù)平臺,也就談不上對這些大數(shù)據(jù)的分析利用。
“在當前和可預(yù)見的未來,必須研究什么數(shù)據(jù)和信息是現(xiàn)有的各種大系統(tǒng)所無法提供的,又有哪些可以通過構(gòu)造超巨系統(tǒng)來采集和進行大數(shù)據(jù)分析。”周宏仁強調(diào),“當前,很多部門和地方對大數(shù)據(jù)的炒作比較多,而深入地研究大數(shù)據(jù)的發(fā)生和發(fā)展、大數(shù)據(jù)的應(yīng)用策略則比較少。當前,首先要搞清楚的是中國需要什么樣的大數(shù)據(jù),因而需要構(gòu)造哪些超巨系統(tǒng),優(yōu)先級應(yīng)該如何安排。顯然,超巨系統(tǒng)建設(shè)愈多,國家數(shù)據(jù)資源開發(fā)利用的水平就越高,國家信息能力就越強,國家信息優(yōu)勢也越為顯著。”