從IT到DT,技術(shù)的發(fā)展使人類(lèi)真正有了預(yù)測(cè)未來(lái)的基礎(chǔ)能力。中國(guó)數(shù)據(jù)分析技術(shù)的市場(chǎng)據(jù)預(yù)測(cè)將從2015年的45億美元增長(zhǎng)到2022年的368.6億美元。在行業(yè)應(yīng)用分布上,政府、銀行、零售業(yè)是大數(shù)據(jù)分析市場(chǎng)最大的用戶(hù) 。
在互聯(lián)網(wǎng)和大數(shù)據(jù)時(shí)代,人類(lèi)所有行為包括思想都會(huì)被記錄下來(lái)并存儲(chǔ)成數(shù)據(jù),它是真實(shí)世界和虛擬世界之間的映射,構(gòu)成了另一個(gè)世界,而且根據(jù)國(guó)家統(tǒng)計(jì)局信息,諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者均有深厚統(tǒng)計(jì)學(xué)分析背景——即大數(shù)據(jù)分析背景。
數(shù)據(jù)是靈性和理性的結(jié)合,在當(dāng)今世界海量數(shù)據(jù)是第一位資源,對(duì)于數(shù)據(jù)的發(fā)展和規(guī)劃,反映出國(guó)家、行業(yè)和思想界的路徑方法。從中央政府最近發(fā)布的《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》來(lái)看,大數(shù)據(jù)的發(fā)展戰(zhàn)略已被納入到國(guó)家級(jí)和經(jīng)濟(jì)策略級(jí)的發(fā)展中,也被看做以市場(chǎng)作為資源配置的決定性因素,數(shù)據(jù)技術(shù)、產(chǎn)業(yè)發(fā)展必將促進(jìn)中國(guó)從IT到DT的發(fā)展,加速中國(guó)經(jīng)濟(jì)轉(zhuǎn)型的過(guò)程。
全球科技創(chuàng)新趨勢(shì)正在發(fā)生巨變。大數(shù)據(jù)是人類(lèi)社會(huì)的第一資源,對(duì)這一資源的有效利用和加工再生產(chǎn),必將會(huì)對(duì)社會(huì)經(jīng)濟(jì)發(fā)展起到極大的推動(dòng)作用,進(jìn)而使人類(lèi)可以更理性地分析世界、預(yù)知世界、應(yīng)對(duì)未來(lái),中國(guó)已經(jīng)在大數(shù)據(jù)領(lǐng)域以后發(fā)優(yōu)勢(shì)的態(tài)勢(shì)走到世界的前列,繼續(xù)堅(jiān)持下去,中國(guó)將會(huì)執(zhí)世界經(jīng)濟(jì)發(fā)展之牛耳!那么大數(shù)據(jù)又將如何幫助改變企業(yè)、國(guó)家間的競(jìng)爭(zhēng)格局?中國(guó)在基礎(chǔ)領(lǐng)域及數(shù)據(jù)庫(kù)研發(fā)領(lǐng)域最主要問(wèn)題是什么?政策層面應(yīng)如何加以引導(dǎo)解決這些問(wèn)題?
《華夏時(shí)報(bào)》記者新近約請(qǐng)柏睿數(shù)據(jù)科技有限公司董事長(zhǎng)兼CTO劉睿民接受專(zhuān)訪(fǎng),深入闡述相關(guān)問(wèn)題。
曾任多家世界級(jí)跨國(guó)IT公司大中國(guó)區(qū)及亞太高管的柏睿數(shù)據(jù)公司創(chuàng)始人劉睿民,曾在國(guó)內(nèi)上市公司華勝天成擔(dān)任CTO,歸國(guó)前在硅谷Tandem公司師從圖靈獎(jiǎng)大神級(jí)得主Jim Gray,共同參與過(guò)Tandem NonStop SQL/MP的內(nèi)核編寫(xiě)。據(jù)業(yè)界權(quán)威人士介紹,Tandem公司的MPP分布式數(shù)據(jù)庫(kù)迄今為止依然在歐美的高端市場(chǎng)傲視群雄。
劉睿民認(rèn)為,大數(shù)據(jù)時(shí)代的國(guó)家競(jìng)爭(zhēng)發(fā)展優(yōu)勢(shì),就是對(duì)海量數(shù)據(jù)進(jìn)行分析,讓數(shù)據(jù)變成對(duì)社會(huì)有價(jià)值的產(chǎn)品。目前中國(guó)雖初步具有這種能力,但空間還很巨大,因此劉睿民建議,政府決策部門(mén)應(yīng)緊急設(shè)立首席數(shù)據(jù)官,這將有助于國(guó)家宏觀(guān)戰(zhàn)略決策中,各種數(shù)據(jù)不協(xié)調(diào)造成的應(yīng)用管理中諸多問(wèn)題獲得解決。
大數(shù)據(jù)VS人與社會(huì)與國(guó)家
《華夏時(shí)報(bào)》:學(xué)術(shù)界有句話(huà)叫“透過(guò)數(shù)據(jù)看本質(zhì)”,我們看到,包括您在內(nèi),當(dāng)今海內(nèi)外的學(xué)者正在以空前的熱情投入用大數(shù)據(jù)研究和解決中國(guó)問(wèn)題的事業(yè)中來(lái),這一趨勢(shì)所反映的本質(zhì)是什么?
劉睿民:大數(shù)據(jù)產(chǎn)業(yè)其實(shí)是國(guó)家軟實(shí)力的重要體現(xiàn),記得我們從事大數(shù)據(jù)研究項(xiàng)目最早的一個(gè)案子,來(lái)自于傳統(tǒng)制造業(yè),時(shí)間大概在一年半以前。當(dāng)時(shí)我們覺(jué)得很奇怪,制造業(yè)為何對(duì)大數(shù)據(jù)如此感興趣?盡管那時(shí)大家都覺(jué)得制造業(yè)似乎在走下坡路,但制造業(yè)是真正的實(shí)業(yè),由于其利潤(rùn)薄、生產(chǎn)效率相對(duì)較低,因此需要考慮如何從中國(guó)制造轉(zhuǎn)向中國(guó)智造的產(chǎn)業(yè)轉(zhuǎn)型問(wèn)題。而所有產(chǎn)業(yè)轉(zhuǎn)型都必須建立在對(duì)各類(lèi)數(shù)據(jù)的精確管理上,數(shù)據(jù)最后會(huì)體現(xiàn)出產(chǎn)業(yè)增長(zhǎng)和精細(xì)化管理的整體面貌。
從工廠(chǎng)管理到城市管理再到國(guó)家管理,都要靠數(shù)據(jù)來(lái)說(shuō)話(huà),都要根據(jù)數(shù)據(jù)所說(shuō)的話(huà)來(lái)加以調(diào)整。比如國(guó)家統(tǒng)計(jì)局依據(jù)傳統(tǒng)統(tǒng)計(jì)科學(xué)統(tǒng)計(jì)各種經(jīng)濟(jì)增長(zhǎng)數(shù)據(jù),如果與大數(shù)據(jù)管理方法結(jié)合起來(lái),則其統(tǒng)計(jì)結(jié)果就能幫助人們更深入、更實(shí)時(shí)交互地了解或判斷當(dāng)前經(jīng)濟(jì)真實(shí)狀況,甚至幫助人們預(yù)測(cè)未來(lái)的經(jīng)濟(jì)變化趨勢(shì)。
再比如過(guò)去一向很保守的傳統(tǒng)金融業(yè),在遭受了互聯(lián)網(wǎng)金融的刺激之后,其數(shù)據(jù)量開(kāi)始變得很龐大,這引發(fā)了監(jiān)管難題。尤其對(duì)于P2P,其所有交易都是多點(diǎn)對(duì)多點(diǎn)交易,監(jiān)管難度很大。所以,一個(gè)需要清晰認(rèn)識(shí)的問(wèn)題是,如何通過(guò)數(shù)據(jù)管理這些經(jīng)營(yíng)活動(dòng)?
在國(guó)家治理層面,決策者所看到的,可能是如何通過(guò)數(shù)據(jù)管理國(guó)家的問(wèn)題。
透過(guò)數(shù)據(jù)看本質(zhì),我們所看到的都是從宏觀(guān)到微觀(guān)的一系列需要以數(shù)據(jù)來(lái)支持和幫助人們解決的問(wèn)題。
《華夏時(shí)報(bào)》:大數(shù)據(jù)將如何改變?nèi)撕蜕鐣?huì)的思維?改變企業(yè)、國(guó)家間的競(jìng)爭(zhēng)格局?
劉睿民:上世紀(jì)90年代我在美國(guó)從事大數(shù)據(jù)研究工作,有機(jī)會(huì)接觸到技術(shù)上通常比較超前的美國(guó)軍方的一些項(xiàng)目,這包括無(wú)人自動(dòng)駕駛技術(shù)、輿情監(jiān)控技術(shù)、欺詐檢測(cè)技術(shù)等。當(dāng)互聯(lián)網(wǎng)數(shù)據(jù)爆發(fā)之后,許多原先屬于軍用的技術(shù)漸漸變成了普通的民用技術(shù),被運(yùn)用于企業(yè)或國(guó)家間的經(jīng)濟(jì)發(fā)展競(jìng)爭(zhēng)之中。最早出現(xiàn)的輿情監(jiān)控技術(shù),現(xiàn)在就已被許多地方政府普遍運(yùn)用,并且下一步,輿情監(jiān)控技術(shù)將會(huì)有進(jìn)一步發(fā)展,變得可以引導(dǎo)輿情走向。較早被銀行使用的欺詐檢測(cè)技術(shù),現(xiàn)在已經(jīng)在制造業(yè)得到廣泛使用。
數(shù)據(jù)可能會(huì)泄露,也可能會(huì)透過(guò)某種方式滲透進(jìn)入網(wǎng)絡(luò)中,可以通過(guò)排序、機(jī)器學(xué)習(xí),通過(guò)人工干預(yù)的半監(jiān)督學(xué)習(xí)、深度學(xué)習(xí),拼湊出某種完整圖景,以探索出并固定住某種經(jīng)驗(yàn)。人類(lèi)過(guò)去從沒(méi)做到這一點(diǎn)。機(jī)器累積的這種認(rèn)知能力,將大為提升人類(lèi)使用知識(shí)的能力。
比如天氣APP與地理APP的整合,就可能精確地告訴人類(lèi)在某種天氣形勢(shì)下某些地區(qū)的某些狀況會(huì)出現(xiàn)什么樣的變化幾率。這也就是說(shuō),過(guò)去靠人的經(jīng)驗(yàn)判斷的變化,今后可以由機(jī)器幫助人類(lèi)做出更精確判斷。這可能將從根本上改變?nèi)祟?lèi)的思維習(xí)慣。
《華夏時(shí)報(bào)》:如果大數(shù)據(jù)的核心就是預(yù)測(cè),它能預(yù)測(cè)些什么?
劉睿民:所謂預(yù)測(cè),正如剛才所言,只是將不同的人對(duì)一些特別環(huán)境的感受、判斷等數(shù)字化之后,通過(guò)各種APP加以搜集并放入數(shù)據(jù)庫(kù),再進(jìn)行檢索、分類(lèi),以及監(jiān)督學(xué)習(xí)算法、學(xué)習(xí)處理模板,和通過(guò)半監(jiān)督學(xué)習(xí)對(duì)監(jiān)督學(xué)習(xí)模板進(jìn)行校正——大約就是這樣的一種原理。但其所有的步驟都涉及到不同算法,比如排序、分類(lèi)、聚類(lèi),以及深度學(xué)習(xí)算法等。這些算法在上世紀(jì)八十年代都已出現(xiàn),但至今并未有突破性進(jìn)展,并未發(fā)生質(zhì)變,而只是量變,是在廣度上發(fā)生了變化。不同維度上的數(shù)據(jù)量的增加,產(chǎn)生了不同的聚合,現(xiàn)在很多深度學(xué)習(xí)的算法與高性能計(jì)算中所用到的算法并無(wú)二致。而高性能計(jì)算中所用到的數(shù)據(jù)過(guò)去就已經(jīng)很大。所不同的是,一個(gè)用在科研上,一個(gè)用在生活中。
大數(shù)據(jù)的預(yù)測(cè),并非是指其能準(zhǔn)確的看到未來(lái),而是指其判斷結(jié)果可能更接近實(shí)際值。
《華夏時(shí)報(bào)》:通過(guò)大數(shù)據(jù)管理有無(wú)可能看到競(jìng)爭(zhēng)的對(duì)方將來(lái)的預(yù)定發(fā)展策略?
劉睿民:完全有這種可能。在算法不變的前提下,收集的競(jìng)爭(zhēng)對(duì)手行為特征如果從10個(gè)擴(kuò)大到10萬(wàn)個(gè),且具備分析這10萬(wàn)個(gè)行為特征的計(jì)算能力,則分析的結(jié)果就可能很接近實(shí)際的情況。據(jù)此,就可做些推演,設(shè)想將會(huì)出現(xiàn)的變化,再根據(jù)算法做些調(diào)優(yōu),就確實(shí)有可能預(yù)料到對(duì)方所出的牌。但這更多只能算是一種推演,而不能算是預(yù)測(cè)。預(yù)測(cè)是按照某種路徑推論,而推演則可能有若干個(gè)路徑。但二者導(dǎo)致的結(jié)果都尚不具備唯一性。
美國(guó)大數(shù)據(jù)管理在算法、計(jì)算能力、模式創(chuàng)新等方面都要比中國(guó)走得快許多,這首先是因?yàn)槊绹?guó)在數(shù)據(jù)庫(kù)方面已有很多年積累,中國(guó)的大數(shù)據(jù)積累只是從上世紀(jì)九十年代才開(kāi)始啟動(dòng),這兩年才真正熱起來(lái)。像Hadoop、spark等一些關(guān)鍵技術(shù),我在2005年的時(shí)候才聽(tīng)到國(guó)內(nèi)有提起。
《華夏時(shí)報(bào)》:中國(guó)在大數(shù)據(jù)管理方面如此落后,會(huì)否在國(guó)際競(jìng)爭(zhēng)戰(zhàn)略上有所體現(xiàn)?
劉睿民:現(xiàn)在我們的競(jìng)爭(zhēng)戰(zhàn)略可能更多的是靠人、靠傳統(tǒng)智慧來(lái)做分析判斷和設(shè)計(jì),靠數(shù)據(jù)說(shuō)話(huà)的程度可能并不很多。但這方面應(yīng)該只比美國(guó)差,比俄日、比英法德應(yīng)該并不差。
《華夏時(shí)報(bào)》:由此來(lái)看,是否可以說(shuō),在中國(guó)人還沒(méi)出招的時(shí)候,美國(guó)人已經(jīng)知道中國(guó)人大約會(huì)出什么招?
劉睿民:這種危險(xiǎn)性可能真的存在,卻可能未必被真正清醒意識(shí)到。僅從經(jīng)濟(jì)學(xué)角度看,美國(guó)獲得諾獎(jiǎng)的幾位計(jì)量經(jīng)濟(jì)學(xué)家,包括他們的學(xué)生,這些人當(dāng)中很多原來(lái)都是學(xué)數(shù)學(xué)的,之后形成芝加哥學(xué)派,其中一些人去了華爾街做對(duì)沖基金,也有的去美國(guó)財(cái)政部任職,參與政策制定。這些人長(zhǎng)期被數(shù)據(jù)所熏陶。
美聯(lián)儲(chǔ)采取加息之類(lèi)的政策之前,相信更多會(huì)采取計(jì)量經(jīng)濟(jì)學(xué)上的一些方法論并結(jié)合大數(shù)據(jù)再做出判斷。
《華夏時(shí)報(bào)》:根據(jù)IDC的預(yù)測(cè),經(jīng)濟(jì)高速發(fā)展下的中國(guó)產(chǎn)生全球21%的數(shù)據(jù),其比重已遠(yuǎn)超中國(guó)人口占全球的比重,這是些什么樣的數(shù)據(jù)?對(duì)其應(yīng)用價(jià)值可以做怎樣的評(píng)估?
劉睿民:這一數(shù)據(jù)似乎有些保守。中國(guó)是個(gè)跳躍式發(fā)展的國(guó)家,而且一步就跳躍到互聯(lián)網(wǎng)發(fā)展時(shí)代。所以,中國(guó)巨大的人口基數(shù)使得中國(guó)產(chǎn)生的數(shù)據(jù)量可能占全球的25%到30%。
這些數(shù)據(jù)專(zhuān)業(yè)術(shù)語(yǔ)稱(chēng)之為結(jié)構(gòu)化數(shù)據(jù)或非結(jié)構(gòu)化數(shù)據(jù),通常以字節(jié)有無(wú)規(guī)律可循來(lái)劃分。從這些數(shù)據(jù)中可以判斷出各種行為取向,據(jù)此可以發(fā)現(xiàn)各種商業(yè)價(jià)值。從國(guó)家間競(jìng)爭(zhēng)或社會(huì)治理角度看,甚至據(jù)此可以對(duì)某個(gè)人建立一個(gè)有關(guān)其行為習(xí)慣的數(shù)據(jù)信息庫(kù),從而推演出其行為的傾向性特征。
《華夏時(shí)報(bào)》:大數(shù)據(jù)的另一面是什么?比如對(duì)數(shù)據(jù)的壟斷,形成某種監(jiān)控,它會(huì)否造成嚴(yán)重的社會(huì)問(wèn)題甚至國(guó)家治理層面的問(wèn)題?大數(shù)據(jù)最終會(huì)否成為人類(lèi)的敵人?
劉睿民:軟件業(yè)的人都知道,沒(méi)有人寫(xiě)軟件沒(méi)有bug。這個(gè)bug到底會(huì)出現(xiàn)在哪里?如果只是通過(guò)數(shù)據(jù)去啟動(dòng)軟件,并與武器結(jié)合,確實(shí)不太容易控制,也確實(shí)對(duì)人類(lèi)很有危險(xiǎn),但目前還沒(méi)有到危害人類(lèi)的階段。大數(shù)據(jù)更多的只是一種算法的判斷,并停留在有點(diǎn)接近于人類(lèi)思維的模板上面,并沒(méi)有跨越到自己去思維的程度。
至于超算,它是一種更高級(jí)的計(jì)算,但在超算的競(jìng)爭(zhēng)層面,這么多年也尚未出現(xiàn)實(shí)質(zhì)性突破,尚未出現(xiàn)一種能夠顛覆整個(gè)游戲規(guī)則的算法。大數(shù)據(jù)的深度學(xué)習(xí)算法,應(yīng)該與超算結(jié)合起來(lái)。我們正在與一些研究機(jī)構(gòu)建立這樣的聯(lián)合實(shí)驗(yàn)室,試圖將深度學(xué)習(xí)上的一些研究成果與實(shí)際案例中的問(wèn)題結(jié)合起來(lái),使深度學(xué)習(xí)的一些算法更加實(shí)用。
比如對(duì)于最近人民幣匯率的急劇變動(dòng),國(guó)內(nèi)采用了一些非常手段加以控制,以傳統(tǒng)智慧見(jiàn)招拆招,而非通過(guò)大數(shù)據(jù)管理提出應(yīng)對(duì)舉措。
大數(shù)據(jù)的商業(yè)價(jià)值
及其應(yīng)用技術(shù)競(jìng)爭(zhēng)
《華夏時(shí)報(bào)》:大數(shù)據(jù)現(xiàn)在熱得發(fā)燙,大數(shù)據(jù)運(yùn)用業(yè)已上升為國(guó)家戰(zhàn)略,這被認(rèn)為是大數(shù)據(jù)企業(yè)難得的戰(zhàn)略機(jī)遇,大數(shù)據(jù)產(chǎn)業(yè)將大繁榮、大發(fā)展,中國(guó)社會(huì)將進(jìn)入大數(shù)據(jù)時(shí)代。但實(shí)際很多企業(yè)尚未找到利用大數(shù)據(jù)創(chuàng)新、創(chuàng)業(yè)的“門(mén)道”。大數(shù)據(jù)在中國(guó)究竟如何真正產(chǎn)生巨大商業(yè)價(jià)值?
劉睿民:對(duì)于大數(shù)據(jù),現(xiàn)在出現(xiàn)一眾圍觀(guān)的現(xiàn)象,所有的人都在談大數(shù)據(jù),好像連云計(jì)算都不太談了。這一方面是由于云計(jì)算競(jìng)爭(zhēng)比較激烈,另一方面我們也看到,很多原來(lái)做軟件的人,都給自己戴上大數(shù)據(jù)的頭冠。
但在數(shù)據(jù)領(lǐng)域中國(guó)落后很多的原因,是企業(yè)也好政府也好往往都被話(huà)題引導(dǎo),而沒(méi)有扎扎實(shí)實(shí)做一些事情。所以我們一上來(lái)就做基礎(chǔ)軟件。2014年我拿出了第一個(gè)大數(shù)據(jù)的國(guó)產(chǎn)數(shù)據(jù)庫(kù)。
大數(shù)據(jù)創(chuàng)新更多體現(xiàn)在基礎(chǔ)軟件層面,體現(xiàn)在數(shù)據(jù)處理和深度學(xué)習(xí)方面。而中國(guó)與美國(guó)的差距正體現(xiàn)在這些領(lǐng)域。
差距還體現(xiàn)在大學(xué)教育方面。美國(guó)很多著名大學(xué)開(kāi)設(shè)數(shù)據(jù)庫(kù)專(zhuān)業(yè)課程,中國(guó)在這方面很欠缺。
中國(guó)在大數(shù)據(jù)方面存在的欠缺,恰是一種價(jià)值洼地,能產(chǎn)生巨大的商業(yè)價(jià)值。
長(zhǎng)遠(yuǎn)來(lái)看,政府和企業(yè)今后更多的是要做一些基礎(chǔ)性工作。熱潮總是要退卻,到一定程度,還要去偽存真,最終看基礎(chǔ)是否扎實(shí),因此要多借助開(kāi)源的東西,但開(kāi)源的東西并不能解決所有的問(wèn)題。比如中國(guó)大陸之前做linux沒(méi)能成功,因?yàn)殚_(kāi)源更多的是一種生態(tài),圍繞其周邊有很多深入開(kāi)發(fā)商業(yè)軟件的公司。甲骨文公司最早的數(shù)據(jù)庫(kù)軟件也吸收了開(kāi)源很多東西,最終它成為了商業(yè)數(shù)據(jù)庫(kù)軟件巨頭。這值得我們借鑒。
如何在當(dāng)今數(shù)據(jù)大爆發(fā)時(shí)代使自己有一個(gè)好的定位,政府如何引導(dǎo)開(kāi)發(fā)大數(shù)據(jù)商業(yè)價(jià)值,都是值得深入思考的問(wèn)題。
《華夏時(shí)報(bào)》:柏睿數(shù)據(jù)在國(guó)內(nèi)首創(chuàng)的MPP內(nèi)存數(shù)據(jù)倉(cāng)庫(kù)被認(rèn)為是中國(guó)數(shù)據(jù)倉(cāng)庫(kù)領(lǐng)域的“諾曼底反攻”,并且最近完成接近千萬(wàn)美元級(jí)融資。柏睿數(shù)據(jù)前不久還獲得“2015年度中國(guó)軟件和信息服務(wù)大數(shù)據(jù)領(lǐng)域最佳產(chǎn)品獎(jiǎng)”,并且據(jù)悉柏睿數(shù)據(jù)被授權(quán)撰寫(xiě)了數(shù)據(jù)庫(kù)國(guó)家級(jí)標(biāo)準(zhǔn)。為什么柏睿數(shù)據(jù)這么“火”?
劉睿民:媒體所稱(chēng)中國(guó)數(shù)據(jù)倉(cāng)庫(kù)領(lǐng)域的“諾曼底反攻”,并不算夸張。中國(guó)大陸做分布式數(shù)據(jù)庫(kù)的人很少,而做內(nèi)存式數(shù)據(jù)庫(kù)的幾乎根本就沒(méi)有。上世紀(jì)九十年代中期以后,中國(guó)大陸數(shù)據(jù)庫(kù)行業(yè)一直為美、德等國(guó)外廠(chǎng)商所壟斷。當(dāng)時(shí)中國(guó)本土眾多軟件公司所追求的,可能更多的是短期效益,而不愿掙數(shù)據(jù)庫(kù)這樣的慢錢(qián)。再加上數(shù)據(jù)庫(kù)本身技術(shù)標(biāo)準(zhǔn)嚴(yán)苛,對(duì)算法穩(wěn)定性要求很高,實(shí)現(xiàn)難度較大,是一種慢工出細(xì)活的領(lǐng)域,中國(guó)公司如果起步晚,積累少,肯定就會(huì)顯得落后,所以這種支撐大數(shù)據(jù)核心發(fā)展的基礎(chǔ)技術(shù)需要國(guó)家的大力支持。
現(xiàn)在大數(shù)據(jù)時(shí)代到來(lái),數(shù)據(jù)大暴漲,人們對(duì)數(shù)據(jù)的要求也越來(lái)越高,勢(shì)不可擋。甚至房地產(chǎn)商做所謂場(chǎng)景消費(fèi)也需要用到大數(shù)據(jù),這是以前所無(wú)法想象。當(dāng)今人的互聯(lián)、物的互聯(lián)正在不斷加強(qiáng),而工業(yè)4.0,中國(guó)智造,也都是充分條件,大數(shù)據(jù)即將時(shí)勢(shì)造英雄,也是柏睿數(shù)據(jù)的流數(shù)據(jù)庫(kù)走上臺(tái)面的良好時(shí)機(jī)。
兩年之前我即開(kāi)始啟動(dòng)流數(shù)據(jù)庫(kù)的研究,那時(shí)國(guó)內(nèi)還沒(méi)有人提這項(xiàng)研究。因?yàn)闀r(shí)勢(shì)都未到,但它所發(fā)生的必要條件均已具備。今后將要充分發(fā)揮這些必要條件。中美專(zhuān)家包括中國(guó)工信部專(zhuān)家都對(duì)于流數(shù)據(jù)庫(kù)在中國(guó)國(guó)內(nèi)出現(xiàn)感到驚訝。柏睿數(shù)據(jù)撰寫(xiě)的數(shù)據(jù)庫(kù)標(biāo)準(zhǔn)已被認(rèn)定為中國(guó)國(guó)家級(jí)標(biāo)準(zhǔn),受到國(guó)內(nèi)外同行的充分肯定。
《華夏時(shí)報(bào)》:你怎么看貴公司的行業(yè)和技術(shù)地位?
劉睿民:行業(yè)地位應(yīng)處于前三,公司和個(gè)人的技術(shù)研究實(shí)力應(yīng)排名第二。
《華夏時(shí)報(bào)》:您被認(rèn)為是大數(shù)據(jù)行業(yè)的一匹黑馬,被工信部聘為國(guó)際專(zhuān)家,同時(shí)被國(guó)際標(biāo)準(zhǔn)委員會(huì)指定為國(guó)際協(xié)調(diào)員。您這么“火”,你所向往的人生目標(biāo)是什么?
劉睿民:自己并不覺(jué)得有多么“火”,做好數(shù)據(jù)庫(kù)還須有賴(lài)于自己很多年的積累。我首次見(jiàn)到我的導(dǎo)師Jim Gray是在1996年,當(dāng)時(shí)他給了我一個(gè)bug,說(shuō)你去做吧,這讓我感到很郁悶,心想不就是一個(gè)bug嗎,后來(lái)才知道,在我當(dāng)時(shí)工作的這個(gè)惠普實(shí)驗(yàn)室,一個(gè)bug很有深度,沒(méi)有三個(gè)月的時(shí)間解不出這個(gè)bug。但一個(gè)多月后我解出了這個(gè)bug,這讓導(dǎo)師很吃驚。后來(lái)我接的客戶(hù)有很多都是世界級(jí)客戶(hù),其中包括美國(guó)國(guó)防部、維薩組織、沃爾瑪?shù)龋械目蛻?hù)其分布式數(shù)據(jù)庫(kù)里的集群有1024個(gè)節(jié)點(diǎn)。一個(gè)打算要進(jìn)入到數(shù)據(jù)庫(kù)這個(gè)行業(yè)的人,之前必須要有5年寫(xiě)底層代碼的經(jīng)驗(yàn),進(jìn)入之后還要寫(xiě)6、7年的代碼。這樣才可能駕馭數(shù)據(jù)庫(kù)整體架構(gòu)的東西。我未必是黑馬,但卻是有長(zhǎng)期積累的熟練工,又正好碰到當(dāng)前大數(shù)據(jù)發(fā)展興盛的時(shí)點(diǎn)。關(guān)于我的人生目標(biāo),我的投資人汪潮涌先生曾問(wèn)過(guò)我,我的回答是,如果我的數(shù)據(jù)庫(kù)系統(tǒng)寫(xiě)得好,被產(chǎn)業(yè)界認(rèn)可,那么,之后我將回到學(xué)校里,從理論上加以提煉和總結(jié),并傳授給學(xué)生,這才是真正有很重要意義的事情。汪先生很認(rèn)同我的這一人生目標(biāo)。
《華夏時(shí)報(bào)》:如何看下一代軟件開(kāi)發(fā)技術(shù)趨勢(shì)與對(duì)各行業(yè)的深刻影響?
劉睿民:下一代軟件開(kāi)發(fā)技術(shù)趨勢(shì)可能會(huì)有很大變化。并行計(jì)算今后可能會(huì)要求很高,這其實(shí)也是我們正在做的事情之一。但對(duì)有些概念,國(guó)內(nèi)存在混淆現(xiàn)象。比如我一直堅(jiān)持說(shuō)MPP內(nèi)存數(shù)據(jù)庫(kù),有的人卻說(shuō)這是分布式數(shù)據(jù)庫(kù),其實(shí)MPP也是一種分布式,而原則上,MPP是海量并行處理,算是一種分布式,但分布式并不見(jiàn)得是MPP。所謂并行處理是說(shuō)每個(gè)處理單元與其它單元有關(guān)聯(lián)。最近兩年,并行計(jì)算確實(shí)出現(xiàn)了一些語(yǔ)言或軟件開(kāi)發(fā)方法,這一趨勢(shì)比較明顯。尤其是當(dāng)處理的數(shù)據(jù)量很多,則對(duì)之后的影響會(huì)很大。這方面,國(guó)內(nèi)積累真的不多。
《華夏時(shí)報(bào)》:在您看來(lái),一個(gè)完美的大數(shù)據(jù)處理系統(tǒng)究竟是怎樣的架構(gòu)?
劉睿民:三年前,我曾認(rèn)為,理想中一個(gè)分布式的MPP的海量并行的內(nèi)存數(shù)據(jù)庫(kù)就已足夠,我能處理的數(shù)據(jù)比如說(shuō)當(dāng)時(shí)是64G的內(nèi)存有100個(gè)節(jié)點(diǎn)6個(gè)T的數(shù)據(jù),就讓我覺(jué)得很大了。但去年很多用戶(hù)已開(kāi)始問(wèn)我,你們能不能處理256G內(nèi)存的單節(jié)點(diǎn)的數(shù)據(jù)。這個(gè)發(fā)展真是太快了。
下一個(gè)趨勢(shì)是,單節(jié)點(diǎn)可能至少要處理4個(gè)T的數(shù)據(jù),4個(gè)T1000個(gè)節(jié)點(diǎn)就是4000T。在做好算法,系統(tǒng)穩(wěn)定的條件下,4個(gè)T數(shù)據(jù)可在數(shù)分鐘之內(nèi)處理完畢。這是一個(gè)比較漂亮的結(jié)果。
就硬件而言,CPU自身速度在提高。而分布式計(jì)算集群現(xiàn)在越來(lái)越大。這在之前很難預(yù)料。
我們的內(nèi)存數(shù)據(jù)庫(kù)內(nèi)部測(cè)試現(xiàn)在已達(dá)到256個(gè)節(jié)點(diǎn),下一步可能是512個(gè)節(jié)點(diǎn),這是數(shù)據(jù)庫(kù)的一個(gè)比較大的變化趨勢(shì)。三年前我開(kāi)始考慮的流數(shù)據(jù)庫(kù),去年這一想法已開(kāi)始成熟,原以為可能要等候兩三年能出成果,現(xiàn)在看,如果每個(gè)人手中的手機(jī)云端數(shù)據(jù)直接進(jìn)入我的有數(shù)百臺(tái)機(jī)器組成的內(nèi)存池子,進(jìn)入流數(shù)據(jù)庫(kù),做一些簡(jiǎn)單查詢(xún),或進(jìn)入分布數(shù)據(jù)庫(kù)做非常復(fù)雜的分布查詢(xún),這些過(guò)程都無(wú)需落地,只在內(nèi)存里跑。這是一個(gè)比較完整的體系。在之后,是深度學(xué)習(xí)的算法,也存于內(nèi)存之中,而且要與數(shù)據(jù)庫(kù)緊密結(jié)合。也就是說(shuō),在只要有數(shù)據(jù)的地方,就有算法圍繞著它。今后會(huì)朝著這個(gè)方向發(fā)展。
大數(shù)據(jù)應(yīng)用涉及國(guó)家戰(zhàn)略
《華夏時(shí)報(bào)》:中國(guó)在基礎(chǔ)領(lǐng)域及數(shù)據(jù)庫(kù)研發(fā)領(lǐng)域最主要問(wèn)題是什么?政策層面應(yīng)如何加以引導(dǎo)解決這些問(wèn)題?
劉睿民:總結(jié)了看,數(shù)據(jù)庫(kù)本身是一個(gè)基礎(chǔ)領(lǐng)域,其研發(fā)主要取決于積累,之后是院校之間與企業(yè)研究成果如何結(jié)合的問(wèn)題。在中國(guó)人民大學(xué)薩師煊教授之后,中國(guó)數(shù)據(jù)庫(kù)領(lǐng)域就再也沒(méi)有權(quán)威性成果問(wèn)世。從這個(gè)意義上看,未來(lái)我們的研究成果如果能變成教材,讓大學(xué)里的學(xué)生學(xué)習(xí)之后能寫(xiě)出簡(jiǎn)單的分布式數(shù)據(jù)庫(kù),我們?nèi)松暮艽笠徊糠帜繕?biāo)就實(shí)現(xiàn)了。
《華夏時(shí)報(bào)》:關(guān)于在一些政府決策部門(mén)設(shè)立首席數(shù)據(jù)官這一職位,您有何看法?是否還早了點(diǎn)?
劉睿民:一點(diǎn)都不早,而是很迫切。
現(xiàn)在我們遇到的很多情況都是拿不到數(shù)據(jù)。有人想做事,但數(shù)據(jù)拿不到,原因就在于行政管理存在條塊分割,這導(dǎo)致數(shù)據(jù)也被隔離開(kāi)。
數(shù)據(jù)到底具有怎樣的價(jià)值,通過(guò)數(shù)據(jù)官的協(xié)調(diào),就可以協(xié)調(diào)出來(lái)。而協(xié)調(diào)的規(guī)則是什么,這也需要探討。
目前中國(guó)的政府部門(mén)和企業(yè)部門(mén)仍以CIO為主處理IT問(wèn)題,尚未設(shè)立CDO即首席數(shù)據(jù)官,企業(yè)部門(mén)只有阿里巴巴公司有CDO,外企設(shè)CDO的比較多。
中國(guó)的政府部門(mén)尤其是決策部門(mén)有必要盡快設(shè)立CDO這一職位,這將有助于使得宏觀(guān)戰(zhàn)略大數(shù)據(jù)應(yīng)用管理中遇到的諸多問(wèn)題獲得解決。
《華夏時(shí)報(bào)》:與全球主要發(fā)達(dá)國(guó)家相比,中國(guó)仍處于大數(shù)據(jù)發(fā)展的初級(jí)階段。如何構(gòu)筑大數(shù)據(jù)時(shí)代的國(guó)家競(jìng)爭(zhēng)發(fā)展優(yōu)勢(shì)?
劉睿民:所謂構(gòu)筑大數(shù)據(jù)時(shí)代的國(guó)家競(jìng)爭(zhēng)發(fā)展優(yōu)勢(shì),就是應(yīng)用數(shù)據(jù)的能力,就是讓數(shù)據(jù)變成有價(jià)值數(shù)據(jù)的能力。目前中國(guó)尚遠(yuǎn)遠(yuǎn)不具備這種能力
《華夏時(shí)報(bào)》:大數(shù)據(jù)安全現(xiàn)在已經(jīng)上升成為國(guó)家安全極為關(guān)鍵的組成部分。您對(duì)此有何建言?
劉睿民:最近我們正在這方面做探索,比如與金融界合作,嘗試將分布式數(shù)據(jù)庫(kù)與區(qū)塊鏈技術(shù)結(jié)合在一起,這意味著可以即時(shí)發(fā)現(xiàn)數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)出狀況。
《華夏時(shí)報(bào)》:最后,能否請(qǐng)您預(yù)測(cè)一下中國(guó)大數(shù)據(jù)變革的前景?
劉睿民:當(dāng)今從事大數(shù)據(jù)應(yīng)用者很多,也有很多從事大數(shù)據(jù)交易的企業(yè),如果能形成合力,整個(gè)大數(shù)據(jù)生態(tài)系統(tǒng)能夠良性循環(huán),將是一件令人樂(lè)觀(guān)的前景,也將會(huì)為中國(guó)大數(shù)據(jù)應(yīng)用發(fā)展積累經(jīng)驗(yàn)和人才。因此,政府需要在這方面積極加以引導(dǎo)。大數(shù)據(jù)應(yīng)用不應(yīng)只是一種熱潮,因?yàn)楫?dāng)熱潮散去,還會(huì)留下什么嗎?如果形成生態(tài)系統(tǒng),在數(shù)據(jù)庫(kù)和數(shù)據(jù)處理方面,包括中間件方面,可能會(huì)有基礎(chǔ)軟件升級(jí)的問(wèn)題要解決,這可能會(huì)導(dǎo)致中國(guó)出現(xiàn)一些大的基礎(chǔ)軟件公司,并與甲骨文公司、SAP公司等國(guó)際巨頭競(jìng)爭(zhēng)。從應(yīng)用軟件方面看,中國(guó)可能會(huì)出現(xiàn)一些突出的應(yīng)用,在虛擬現(xiàn)實(shí)和自動(dòng)駕駛領(lǐng)域,中國(guó)也許同樣會(huì)出現(xiàn)一些大公司。但這同樣需要很多積累。應(yīng)用也需要能夠落實(shí)的環(huán)境。最怕的是大數(shù)據(jù)成為套利的工具。
中央城市工作會(huì)議:為城市正本清源
張險(xiǎn)峰
2015年12月21日,中央城市工作會(huì)議在北京召開(kāi)。就在這一天,北京仍處于有史以來(lái)第二次重度霧霾紅色預(yù)警中。兩起事件同時(shí)發(fā)生看似巧合,其實(shí)有其必然性。因?yàn)樵摃?huì)議劍鋒所指,正是如何化解城市病、推進(jìn)城市更加健康可持續(xù)發(fā)展,而霧霾污染,正是促成此次會(huì)議的主要導(dǎo)火索。
時(shí)隔37年的會(huì)議
2015年歲末,中央召開(kāi)這樣一個(gè)高規(guī)格的城市工作會(huì)議,用意何在?建國(guó)以來(lái),以黨中央、國(guó)務(wù)院名義召開(kāi)的城市工作會(huì)議共有三次,最后一次是改革開(kāi)放之初的1978年,第四次則時(shí)隔37年之久。由此可見(jiàn),中央對(duì)城市在新的歷史時(shí)期如何發(fā)展,有了新的認(rèn)識(shí)和要求。
目前,我國(guó)已進(jìn)入城市型社會(huì),城市已經(jīng)名副其實(shí)地成為創(chuàng)造國(guó)家財(cái)富的主力軍。從1978年改革開(kāi)放之初到2014年末,我國(guó)城市化率從17.9%提升到54.7%,城市數(shù)量從193個(gè)增長(zhǎng)到653個(gè),城市人口已經(jīng)超過(guò)農(nóng)村,并且今后每年城鎮(zhèn)化率仍會(huì)以1%的速度增長(zhǎng)。縱觀(guān)世界城市發(fā)展變化,城市不但從前是、現(xiàn)在是,未來(lái)仍是主導(dǎo)世界發(fā)展潮流的主體,并將繼續(xù)得到強(qiáng)化。
但我國(guó)城市的發(fā)展卻存在很大問(wèn)題,“城市病”是其中典型代表。首先,不可持續(xù)的發(fā)展模式難以為繼,已經(jīng)嚴(yán)重威脅到人民的生命財(cái)產(chǎn)安全,影響到城市經(jīng)濟(jì)社會(huì)的正常運(yùn)行。近年來(lái)生態(tài)危機(jī)、“城市病”集中爆發(fā),霧霾鎖城,暴雨淹城,垃圾圍城,交通堵城,造成大量經(jīng)濟(jì)社會(huì)損失和不良國(guó)際影響。歷史文化屢遭破壞,城市建設(shè)千城一面,人們賴(lài)以寄托情感的精神家園很多已經(jīng)面目全非。這些破壞帶來(lái)的損失,正在一步步蠶食著我們辛辛苦苦換來(lái)的發(fā)展成果,對(duì)子孫后代的發(fā)展造成威脅。
其次,城市發(fā)展對(duì)人的關(guān)懷不夠,已經(jīng)嚴(yán)重影響到城鎮(zhèn)化進(jìn)程和質(zhì)量。尤其是長(zhǎng)期忽視進(jìn)城農(nóng)民工和流動(dòng)人口這一龐大群體,沒(méi)有解決好他們的城鎮(zhèn)居民身份和待遇問(wèn)題,導(dǎo)致社會(huì)不公,矛盾日益凸顯,影響到群眾積極性和創(chuàng)造性的發(fā)揮。城市公共服務(wù)短缺,看病難、升學(xué)難、出行難、就業(yè)難,令普通市民也叫苦不迭。
在經(jīng)濟(jì)發(fā)展動(dòng)力上,過(guò)去所依賴(lài)的出口、投資、內(nèi)需三駕馬車(chē)疲態(tài)盡現(xiàn);而城市產(chǎn)業(yè)轉(zhuǎn)型緩慢,創(chuàng)新驅(qū)動(dòng)不足,也需要尋找新的動(dòng)力。城市積聚著人才、企業(yè)、資金、信息、技術(shù)、文化等全方位要素,是一個(gè)國(guó)家投資、建設(shè)、運(yùn)營(yíng)、創(chuàng)新活動(dòng)最集中的地方,也是節(jié)能減排降耗、實(shí)現(xiàn)綠色發(fā)展的重點(diǎn),大有潛力可挖。會(huì)議提出“讓創(chuàng)新成為城市發(fā)展的主動(dòng)力,釋放城市發(fā)展新動(dòng)能”,可以看出中央已經(jīng)將經(jīng)濟(jì)轉(zhuǎn)型與城市發(fā)展二者統(tǒng)一起來(lái),作為消化工業(yè)過(guò)剩產(chǎn)能和房地產(chǎn)庫(kù)存、創(chuàng)新產(chǎn)業(yè)發(fā)展。
也正因?yàn)樯鲜鲈颍舜沃醒胫匦掳殉鞘凶鳛橐粋€(gè)完整的概念提出來(lái),要求“深刻認(rèn)識(shí)城市在我國(guó)經(jīng)濟(jì)社會(huì)發(fā)展、民生改善中的重要作用”,并將之與經(jīng)濟(jì)工作、農(nóng)村工作放在同等重要的位置,拋出的頂層設(shè)計(jì),以系統(tǒng)改進(jìn)城市規(guī)劃、建設(shè)、管理,提高城市發(fā)展的質(zhì)量和水平,解決群眾關(guān)切的民生問(wèn)題、環(huán)境問(wèn)題。這也是一個(gè)供給端改革,既把城市作為一個(gè)完整的“產(chǎn)品”來(lái)對(duì)待,寄望在提升城市供給能力的過(guò)程中,尋找經(jīng)濟(jì)發(fā)展新的動(dòng)力。而綠色發(fā)展、民生工程將是新的機(jī)遇。
建設(shè)人性化城市
要把城市的作用充分發(fā)揮出來(lái),就必須營(yíng)造出一個(gè)個(gè)健康的、為群眾所喜愛(ài)的城市,但毫無(wú)疑問(wèn)現(xiàn)實(shí)差距不小。盡管西方國(guó)家曾經(jīng)爆發(fā)的“城市病”及其危害早已廣為人知,國(guó)內(nèi)外很多有識(shí)之士、專(zhuān)家學(xué)者也一直不斷地在給政府提醒,但遺憾的是我們?nèi)詻](méi)能幸免。
原因在于頂層設(shè)計(jì)的缺陷,和地方政府的慣性思維,城市發(fā)展圍繞著GDP這個(gè)指揮棒轉(zhuǎn),以地生財(cái)、形象工程、政績(jī)工程大行其道,為此不惜以犧牲生態(tài)環(huán)境、農(nóng)民利益、歷史文化為代價(jià),埋下大量隱患。各類(lèi)規(guī)劃被當(dāng)作爭(zhēng)取城市建設(shè)用地規(guī)模的工具,行政區(qū)劃調(diào)整、特殊政策區(qū)、“農(nóng)民上樓”等成為最常見(jiàn)的手段。城市規(guī)模盲目擴(kuò)張,造成大量“鬼城”和撂荒空地,既造成資源嚴(yán)重浪費(fèi),又犧牲了長(zhǎng)遠(yuǎn)利益,無(wú)異于飲鴆止渴。這種做法自然是漠視了人的主體地位。
此次城市會(huì)議把轉(zhuǎn)變城市發(fā)展觀(guān)念作為首要問(wèn)題提出,強(qiáng)調(diào)要尊重城市發(fā)展規(guī)律,貫徹創(chuàng)新、協(xié)調(diào)、綠色、開(kāi)放、共享的發(fā)展理念,堅(jiān)持以人為本、科學(xué)發(fā)展、改革創(chuàng)新、依法治市。就是要把工作重點(diǎn)放在改進(jìn)城市發(fā)展的質(zhì)量上,摒棄只要地不要人的城鎮(zhèn)化模式。
城市是一個(gè)復(fù)雜的巨系統(tǒng),融合了政治、經(jīng)濟(jì)、社會(huì)、文化、環(huán)境各要素,其發(fā)展建設(shè)也是一個(gè)歷史性的過(guò)程:既有物質(zhì)建設(shè),又有管理運(yùn)營(yíng);既有制度設(shè)計(jì),也需多方?jīng)Q策;既要做好規(guī)劃,也要執(zhí)行到位;既要設(shè)計(jì)科學(xué),也要使用合理。而一旦城市建設(shè)出了問(wèn)題,既可能是規(guī)劃科學(xué)性和預(yù)見(jiàn)性不夠,也可能是管理或?qū)嵤┳邩印⒒驔Q策不夠民主透明,但更多情況下是各部門(mén)之間、各環(huán)節(jié)之間缺乏統(tǒng)籌、各自為政造成的。
眾所周知,城市治理是個(gè)“多龍治水”的系統(tǒng)工程,對(duì)各部門(mén)、各環(huán)節(jié)的協(xié)調(diào)程度要求很高。一直以來(lái),各個(gè)部門(mén)的政策設(shè)計(jì)不可謂不豐富,但收效甚微,關(guān)鍵是各種制度工具的設(shè)計(jì),以及管理實(shí)施缺乏協(xié)調(diào)。部門(mén)間各自為政,甚至相互掣肘、利益博弈。在規(guī)劃、建設(shè)、管理維護(hù)的各個(gè)環(huán)節(jié),各種利益群體訴求不同,在各個(gè)環(huán)節(jié)也都會(huì)出現(xiàn)問(wèn)題。在城市設(shè)施的使用上,一些市民素質(zhì)不高,比如交通違章、擾亂公共秩序、亂丟垃圾等,也會(huì)影響城市運(yùn)行效率,導(dǎo)致城市品質(zhì)下降。正因?yàn)榇耍鞘邪l(fā)展出現(xiàn)了問(wèn)題,不能一概而論,必須弄清楚其中關(guān)節(jié)。
此次會(huì)議從5個(gè)方面提出“統(tǒng)籌”要求,是一次全新的認(rèn)識(shí)。統(tǒng)籌空間、規(guī)模、產(chǎn)業(yè)三大結(jié)構(gòu),目的是改變城市傳統(tǒng)布局模式,促進(jìn)大中小城市、各類(lèi)不同地區(qū)城市合理布局。統(tǒng)籌規(guī)劃、建設(shè)、管理三大環(huán)節(jié),是從操作層面對(duì)城市發(fā)展重點(diǎn)和管理措施提出的要求。統(tǒng)籌改革、科技、文化三大動(dòng)力,是從創(chuàng)新體制機(jī)制,提高城市管理科學(xué)性角度提出的要求。統(tǒng)籌生產(chǎn)、生活、生態(tài)三大布局,是從城市內(nèi)部空間布局的合理性、宜居性、可持續(xù)發(fā)展角度提出的要求。統(tǒng)籌政府、社會(huì)、市民三大主體,是從城市民主決策、多元主體共同參與的角度提出的要求。通過(guò)這5個(gè)方面的統(tǒng)籌,提高城市工作的全局性、系統(tǒng)性、持續(xù)性、宜居性和各方積極性。