一、我國的大數據戰略
近年來,對大數據的定義較為多樣。第462次香山會議 (2013年5月29日—31日)提出了大數據通俗的定義:大數據是數字化生存時代的新型戰略資源,是驅動創新的重要因素,正在改變人類的生產和生活方式。大數據是來源眾多、類型多樣、大而復雜、具有潛在價值,但難以在期望時間內處理和分析的數據集。
我國的“十三五”規劃綱要提出實施國家大數據戰略,把大數據作為基礎性戰略資源,全面實施促進大數據發展行動,加快推動數據資源共享開放和開發應用,助力產業轉型升級和社會治理創新。
大數據的高效采集、有效整合、融合利用可以提高國家宏觀調控、市場監管、社會治理和公共服務的精準性和有效性;依托政府數據建立統一的大數據共享交換平臺,對加快推進跨部門數據資源共享共用具有較強的實踐意義。因此,急需加快深化政府數據和社會數據關聯分析,建設國家政府數據統一開放平臺,推動政府信息系統和公共數據互聯開放共享;研究制定數據開放、保護等法律法規,制定政府信息資源管理辦法;深化大數據在各行業的創新應用,探索與傳統產業協同發展新業態新模式,加快完善大數據產業鏈;加快海量數據采集、存儲、清洗、分析發掘、可視化、安全與隱私保護等領域關鍵技術攻關;促進大數據軟硬件產品發展。完善大數據產業公共服務支撐體系和生態體系,加強標準體系和質量技術基礎建設。
在當前的國內經濟、政策背景下,中國科學院大數據挖掘與知識管理重點實驗室采用先進的數據挖掘技術解決當前社會眾多現實問題,使其真正做到普惠民眾。目前,在大數據支持下,我國已經成功建立全國個人信用評分系統,正在建設新一代居民身份證等一系列重要的個人信息、信用系統。未來的大數據還將繼續深入涉足醫療、生物、航天、金融等社會的各行各業。
二、大數據發展現狀與潛力
數據挖掘的技術應用有其較為普適的流程。在具體實際操作中,我們對來自經濟、社會方面的大數據進行收集,基于Hadoop、Magreduce對大數據進行儲存與處理,然后利用最優化大數據挖掘技術進行大數據挖掘(理論與算法);在大數據的數據處理、分析和挖掘層面上,大數據應該既要全體,又要抽樣,大數據的抽樣比小數據的抽樣更具有普適性;大數據應從粗糙中尋求精確;大數據應從相關關系中把握因果關系與必然關系。 隨后利用大數據智能知識管理,進行大數據知識生成,最后基于大數據科學分析的高層政策建議,將大數據技術應用于社會與經濟層面。
大數據具有4V基本特征:體量大(Volume)、數據類型繁多(Variety)、價值密度低(Value)、處理迅速(Velocity)。隨著經濟社會的健康發展,大數據近些年來呈現出指數級增長趨勢。根據IDC調查的研究報告顯示:2012年全球信息化資料量為2.8ZB (澤字節),其中美國約占全球數據量的32%,西歐占19%,中國占13%,印度占4%,其他市場合占32%;2020年全球的數據資料存儲量將達到40ZB(澤字節),中國將占全球數據產量的22%;40ZB (澤字節)的數據量約等于地球上沙灘上所有沙粒總和的47倍。
在現實生活中,大數據的應用非常廣泛。例如,在商業環境中,通過大數據分析,快銷行業可以更全面地了解客戶的信息,從而準確預測客戶的需求,合理安排商品擺放格局;電信行業可以更好地分析用戶使用習慣及特征,從而準確預測可能流失的客戶,推出更有吸引力的套餐方案;保險行業可以更準確掌握客戶健康情況、駕駛水平等相關信息。其中,大數據發揮顯著作用較為典型的領域是互聯網行業和金融行業。
目前中國大型的商業銀行和保險公司的數據量已經超過100TB,中國金融行業已經形成共識——數據是一種重要的資產。中國金融行業已步入大數據時代的初期階段,并且呈現快速發展勢頭,未來的金融業將開展新一輪圍繞大數據的IT建設投資。優秀的數據分析能力是當今金融市場創新的關鍵,資本管理、交易執行、安全和反欺詐等相關的數據洞察力,成為金融企業運作和發展的核心競爭力。目前,以大數據為代表的新型技術將在兩個層面改造金融業。伴隨著大數據應用、技術革新及商業模式創新,金融業中的銀行和券商也迎來巨大的轉變。金融交易形式的電子化和數字化,如支付電子化、渠道網絡化、信用數字化;金融交易結構的變化,如交易中介脫媒化、服務中介功能弱化。對于風險投資,一個較可行的做法是,在開始時做出定性假設,在中間的決策部分讓定量數據支持和檢驗假設,最后得出定性結論。其中,定量數據部分運用數據挖掘技術,可以為投資決策提供有力的分析支持。
三、“一帶一路”與大數據
(一)“一帶一路”中國企業
2013年秋天,習近平主席提出“一帶一路”的合作建議,即建設“絲綢之路經濟帶”和21世紀“海上絲綢之路”。合作重點主要體現在五個方面:政策溝通、設施聯通、貿易暢通、資金融通、民心相通;而在具體合作領域,主要在地面絲路、海上絲路、空中絲路、能源絲路、電力絲路、信息絲路六個方面展開合作。
根據國務院國資委新聞中心發布的《“一帶一路”中國企業路線圖》,這六大合作領域的領導性企業項目主要是各大國企。
地面絲路,中交集團承建,澤蒙—博爾察大橋、特拉維夫輕軌、蒙內鐵路、塔烏公路、中巴經濟走廊、檳城二橋;中國中鐵承建,埃塞俄比亞鐵路、基甘伯尼大橋、阿斯塔納輕軌、烏茲別克斯坦鐵路、斯里蘭卡南部鐵路、帕德瑪大橋、吉隆坡地鐵。
海上絲路,中國海運是以航運為主業的跨國經營、跨行業、跨地區、跨所有制的特大型綜合型企業集團。招商局集團擁有中國最大超級油輪船隊,在全球15個國家和地區擁有28個港口,旗下港口集裝箱吞吐量居全球第二。
空中絲路,國航計劃年內開通北京-約翰內斯堡、北京—亞的斯亞貝巴航線、北京—明斯克—布達佩斯航線、北京—克拉瑪依—伊寧航線。今年南航將新開廣州—沙巴、萬象、甲米、羅馬、內羅畢等航線,密集覆蓋“一帶一路”沿線國家和地區。
能源絲路,“一帶一路”對應的是一陸一海,陸上絲綢之路經濟帶主要涉及能源、互聯互通、基礎設施建設等方面,而海上絲綢之路主要包含油氣進口、遠洋運輸、國際貿易等領域。結合公司業務特點,中國海油在“一帶一路”兩個方向都可著力。中國海油把握戰略機遇,出臺自己的“一帶一路”規劃,與國家層面的規劃相呼應。
電力絲路,南方電網公司正積極推進與大湄公河次區域國家、港澳地區的電力合作,目前建成的與周邊國家電網互聯互通的項目:與老撾、越南、緬甸聯網。中國國家電網的海外業務覆蓋菲律賓、澳大利亞、意大利等國家,并建成10條與周邊國家互聯互通輸電線路,與俄羅斯、朝鮮等周邊國家建立緊密的合作聯系。
信息絲路,中國聯通與信息化部合作投資建設“中國—緬甸國際路纜”工程、“亞—非—歐國際海纜”工程、SMW5海纜項目和APG海纜項目。TD-LTE國際化已取得初步成效。在我國發起并主導的TD-LTE全球倡議組織 (GTI),已擁有120家運營商及101家設備商。
(二) “一帶一路”特點
“一帶一路”橫跨亞非歐大陸,聯通活躍的亞洲經濟圈和發達的歐洲經濟圈,聯合了60多個沿線國家,經濟發展潛力巨大。然而,巨大發展潛力也意味著合作對象的多樣性、涉獵范圍的廣泛性、數據操作的復雜性和潛在風險的多重性。
“一帶一路”具有當前的時代性特點,并與世界的發展格局相一致。“一帶一路”在許多出發點和建設層面趨同于發達國家推出的常規的區域一體化建設,但又與這些先行的區域一體化政策有所不同。例如,在宏觀政策層面,希望加強雙邊貿易合作、海關合作,減少投資貿易壁壘、促進貿易便利化,逐步建立亞洲乃至亞歐地區貨幣穩定體系、信用體系,全面推進人民幣國際化建設。
但是在具體建設層面,又有其特殊性。根據《推動共建絲綢之路經濟帶和21世紀海上絲綢之路的愿景與行動》,“一帶一路”建設創新性地以設施聯通作為先導領域,通過實現各國基礎設施建設規劃合作及技術領域對接,實現加強各國間骨干通道建設,逐步加強亞歐區域基礎設施網絡建設,從而為貿易合作、投資建設、政治文化交流以及金融互動打下堅實基礎。此外,在“一帶一路”的五個領域重點建設層面,并沒有具體的合作方式和衡量指標。這主要源于“一帶一路”建設的思想以尊重各國政治立場、經濟文化多樣性為立足點,尊重“一帶一路”沿線各國的選擇。因而在具體建設和實際操作中,需要與各個相關國家確定決策思路、工作機制等相關合作環節。而這種對各國情況的包容性、靈活性,則大大加深了風險因素的多樣性、不穩定性以及決策的復雜性。
(三)“一帶一路”建設的風險因素
“一帶一路”建設風險因素的多樣性,體現為貿易風險、投資風險、匯率風險、道德風險、操作風險等。其中,貿易風險、匯率風險和道德風險較為典型。
1.貿易風險
各國貿易額和貿易政策是一個波動的狀態,這通常取決于各國的口岸與物流效率狀況、海關與邊境管理政策、規制環境與金融和電子商務發展條件等。而這些具體指標的變動是未知的,存在一定的風險,如何對該指標體系進行預估,評價貿易便利化程度,從而對雙邊貿易政策提供決策支持,是國際貿易研究中一項重要內容。
傳統的貿易便利化通過貿易引力模型,給出“一帶一路”沿線亞歐國家貿易潛力;基于大數據技術,將會使海量數據的處理更加迅速,對異構數據整理更專業,從而實現對各國、各地區貿易額增加值的精準預估,實現精準貿易。
2.投資風險
投資風險主要體現在以下幾點:海量國民儲蓄由官方外匯儲備更多轉化為在沿線國家生產性投資及相應債權股權;間接投資向直接投資的轉化,使得投資收益、風險等不同維度的指標屬性發生變化;政局不穩定、差距懸殊;投資收益率低、周期長;融資條件有限;投資地區集中且領域單一。因此,新環境、新政策下的指標建立、數據收集清洗、風險分析,需要大數據技術的支持。
3.匯率風險
人民幣國際化是當前國際經濟發展趨勢也是中國一項重要任務,人民幣國際地位的提升,將會引起人民幣匯率的相應變化。“一帶一路“事實上加速了這一進程,同時帶來的匯率變動也是在建設”一帶一路”時需要著重關注的重要風險。近來,隨著英國公投退出歐盟帶來的匯率變化,說明了政治因素可能帶來的匯率風險。由于外在環境條件復雜導致匯率變動的情況也將是多樣的,因而通過大數據技術,對匯率變動進行及時監控、預估,合理規避風險,是我們今后任務的重中之重。
4.道德風險
“一帶一路”沿線國家面臨三重影響,即大國博弈、雙邊爭端以及國內局勢的影響。同時,三方力量相互交織,發揮作用,從而導致國家層面的信譽受損,引發道德風險。對此,可以通過大數據技術,加強道德風險預警機制建設,借鑒企業、個人信用評級技術,對各國、各項目進行道德風險評級預警,從而有針對性地對危機進行測評、監控,增強危機管理的能力。
5.其他風險
除了以上較為典型的風險因素外,還有可能存在政局動蕩、種族紛爭、宗教沖突、恐怖勢力等不安定因素;沿線國家脆弱的金融體系;競爭與產業轉移對中國經濟可能產生的負面效應。
與此同時,這些風險的復雜性主要是由于“一帶一路”涉及范圍廣,關系到各國家經濟、政治、金融、法律、地理(遙感)等;參與對象眾多,涵蓋眾多國家、地區、企業、團體甚至個人;數據結構復雜,非結構化數據與結構化數據摻雜。在這種情況下,大數據技術的應用更顯得尤為重要。通過運用大數據技術,我們可以對多領域異構數據進行收集、清洗、整合;進行大數據指標體系構建,從而為大數據智能決策支持打好堅實的基礎。
大數據通過對組織內部外部的數據進行清洗、分析、整合,可以洞察各數據之間的相關性;經由對歷史數據和現在數據的準確分析,能夠精確預測未來;從而通過對海量數據的挖掘,替代人腦,承擔起社會管理的職責。在經濟學意義上,大數據具有一定的生產要素屬性。對于通常的互聯網企業,該生產要素功能體現在留住客戶、IT與業務結合、促進財務流程轉型、風險評估和合理規避等四個方面。這對于國際性的合作也有相似的意義。例如,在“一帶一路”的建設過程中,針對特定的項目,參與的成員企業,可以通過對相關國家的信息進行整合分析,實現吸引成員國、IT與國際業務相結合、吸引投融資、促進國際收支流程轉型、風險預測和合理規避等具體目的。
大數據技術可以實現對多領域、各層面異構數據進行收集、清洗、整合,實時監控信息動態;協助制定“一帶一路”國家數據標準體系;借鑒以往大數據在個人、企業征信領域的模型,對“一帶一路”沿線國家核投資項目建立各層次風險評估模型;支持中國各級政府政策制定、企業投資決策。