近日,中國管理科學學會大數據管理專委會、國務院發展研究中心產業互聯網課題組、社會科學文獻出版社共同舉辦的《大數據應用藍皮書:中國大數據應用發展報告No.1(2017)》發布會在北京舉行。本書是國內首本研究大數據應用的藍皮書。
藍皮書旨在描述當前中國大數據在相關行業及典型代表企業應用的狀況,分析當前大數據應用中存在的問題和制約其發展的因素,并根據當前大數據應用的實際情況,對其未來發展趨勢做出研判。
藍皮書認為,從應用的角度看,大數據并非一個全新的產業,而是與已有產業融合,對已有模式的改造、升級和替代。制約大數據發展的往往并不是大數據本身,而是大數據所應用的行業和領域原本存在的問題,如行業管制、行政壟斷、要素不能自由流動,等等。因此,推動大數據應用的發展,需對不當的行業管理模式進行改革,對既有利益格局進行調整。即便在企業內部,大數據應用也不僅僅是個技術問題,而且是涉及業務流程重組和管理模式變革的問題,是對企業管理能力的一個考驗。
大數據應用的三個關鍵點
大數據應用的三個關鍵點是數據從哪里來?數據怎么用?成果誰買單?
數據從哪里來?
關于數據來源,普遍認為互聯網及物聯網是產生并承載大數據的基地?;ヂ摼W公司是天生的大數據公司,在搜索、社交、媒體、交易等各自核心業務領域,積累并持續產生海量數據。物聯網設備每時每刻都在采集數據,設備數量和數據量都與日俱增。這兩類數據資源作為大數據金礦,正在不斷產生各類應用。國外關于大數據的成功經驗介紹,大多是這類數據資源應用的經典案例。還有一些企業,在業務中也積累了許多數據,如房地產交易、大宗商品價格、特定群體消費信息,等等。從嚴格意義上說,這些數據資源還算不上大數據,但對商業應用而言,卻是最易獲得和比較容易加工處理的數據資源,也是當前在國內比較常見的應用資源。
在國內還有一類是政府部門掌握的數據資源,普遍認為質量好、價值高,但開放程度差。許多官方統計數據通過灰色渠道流通出來,經過加工成為各種數據產品?!洞髷祿V要》把公共數據互聯開放共享作為努力方向,認為大數據技術可以實現這個目標。實際上,長期以來政府部門間信息數據相互封閉割裂是治理問題而不是技術問題。面向社會的公共數據開放愿望雖十分美好,但恐怕一段時間內可望而不可即。在數據資源方面,國內“小數據”、“中數據”應用并不充分,試圖一步跨入大數據時代,借機一并解決前期信息化過程中沒能解決的問題,前景并不樂觀。另外,由于中國互聯網公司業務主要在國內,其大數據資源也不是全球性的。
藍皮書分析指出,數據從哪里來是我們評價大數據應用的第一個關注點。一是要看這個應用是否真有數據支撐,數據資源是否可持續,來源渠道是否可控,數據安全和隱私保護方面是否有隱患。二是要看這個應用的數據資源質量如何,是“富礦”還是“貧礦”,能否保障這個應用的實效。對于來自自身業務的數據資源,具有較好的可控性,數據質量一般也有保證,但數據覆蓋范圍可能有限,需要借助其他資源渠道。對于從互聯網抓取的數據,技術能力是關鍵,既要有能力獲得足夠大的量,又要有能力篩選出有用的內容。對于從第三方獲取的數據,需要特別關注數據交易的穩定性。數據從哪里來是分析大數據應用的起點,如果一個應用沒有可靠的數據來源,再好、再高超的數據分析技術都是無本之木。
數據怎么用?
數據怎么用是我們評價大數據應用的第二個關注點。《大數據綱要》規劃了許多大數據應用領域和方向,包括公共部門和產業領域,實際上是提出了許多需要大數據解決的問題或期待大數據完成的任務。如何解決這些問題,如何把數據資源轉化為解決方案,實現產品化,這是我們特別關注的問題。大數據只是一種手段,并不能無所不包、無所不用。我們關注大數據能做什么、不能做什么,現在看來,大數據主要有以下幾種較為常用的功能。
追蹤。互聯網和物聯網無時無刻不在記錄,大數據可以追蹤、追溯任何一個記錄,形成真實的歷史軌跡。追蹤是許多大數據應用的起點,包括消費者購買行為、購買偏好、支付手段、搜索和瀏覽歷史、位置信息,等等。
識別。在對各種因素全面追蹤的基礎上,通過定位、比對、篩選,可以實現精準識別,尤其是對語音、圖像、視頻進行識別,使可分析內容大大豐富,得到的結果更為精準。
畫像。通過對同一主體不同數據源的追蹤、識別、匹配,形成更立體的刻畫和更全面的認識。對消費者畫像,可以精準推送廣告和產品;對企業畫像,可以準確判斷其信用及面臨的風險。
提示。在歷史軌跡、識別和畫像基礎上,對未來趨勢及重復出現的可能性進行預測,當某些指標出現預期變化或超預期變化時給予提示、預警。以前也有基于統計的預測,大數據大大豐富了預測手段,對建立風險控制模型有深刻意義。
匹配。在海量信息中精準追蹤和識別,利用相關性、接近性等進行篩選比對,更有效率地實現產品搭售和供需匹配。大數據匹配功能是互聯網約車、租房、金融等共享經濟新商業模式的基礎。
優化。按距離最短、成本最低等給定的原則,通過各種算法對路徑、資源等進行優化配置。對企業而言,提高服務水平、提升內部效率;對公共部門而言,節約公共資源、提升公共服務能力。
上述概括并不一定完備,大數據肯定還有其他更好的功能。當前許多貌似復雜的應用,大都可以細分成以上幾種類型。例如,貴州推行的“大數據精準扶貧項目”,從大數據應用角度,通過識別、畫像,可以對貧困戶實現精準篩選和界定,找對扶貧對象;通過追蹤、提示,可以對扶貧資金、扶貧行為和扶貧效果進行監控和評估;通過配對、優化,可以更好發揮扶貧資源的作用。這些功能也并不都是大數據所特有的,只是大數據遠遠超出以前的技術,可以做得更精準、更快、更好。當然,技術無法左右利益,貴州扶貧目標的完成,并不是有了大數據就萬事大吉了。
成果誰買單?
成果誰買單是我們評價大數據應用的第三個也是最后一個關注點。道理很簡單,不創造價值的應用不是好應用。能不能創造價值,關鍵看誰買單。我們不需要那些靡費公帑的“樣板”工程、“面子”工程,也不需要那些炫耀神技、制造概念的創富故事。我們關注大數據的應用是否實實在在提升能力、改善績效。如果大數據用于自身的產品設計、營銷推廣、資源配置,那就看企業競爭力是不是提升了,看企業最終是不是比以前更賺錢了。如果大數據用于為第三方提供服務,那就看是不是有人愿意付費、愿意持續付費。但如果是用于公共領域,還要看政府或公共部門的付費值不值,不僅僅是從出資方的視角看值不值,還要從老百姓的視角看值不值。
當我們面對一項大數據應用時,只要簡單問一問上面三個問題——數據哪里來、數據怎么用、成果誰買單——就能揭開許多“偽裝”。比如,許多應用并沒有可靠的數據來源,或者數據來源不具備可持續性;還有些應用并沒有技術或市場支撐,只是借助大數據風口套取政府部門或一些投資者的“傻錢”罷了。當然,如果經得起上述“大數據三問”,也并不一定算得上優秀,但也離優秀的大數據應用不遠了。表1列舉了本書中收集的幾個案例,從數據來源、應用方式和創值空間三個角度,可以清晰揭示大數據是如何應用的。當然,這些案例反映的大數據應用既非面面俱到,也不是盡善盡美。我們希望通過這些實際的案例表明大數據應用躊躇前行的步伐和未來發展的前景。
工業大數據面臨三大制約因素
1.工業大數據安全和開放體系亟待建立
數據安全和數據開放體系建立是工業大數據大規模應用的兩個重要前提。如前所述,我國多數工業企業的信息化建設基本上均是由業務部門在業務開展過程中根據自身的局部需求出發,開展建設,缺少統一規劃,形成了部門割據的信息化煙囪,導致數據編碼不一致,系統之間不能相互通信,業務流程不能貫通。因此,我國工業企業無論在數據的總量上,還是數據的質量上,均和歐美發達國家制造企業存在較大差距,且由于行業壟斷或商業利益等原因,數據的開放程度也不高。
另一個制約我國工業大數據應用發展的重要因素是政策法規體系不健全。工業大數據的開發和利用既要滿足工業企業典型應用場景的業務發展需求,也要防止涉及國家、企業秘密的數據發生泄露。而目前,我國在工業大數據的利用、評價、交換以及信息安全保護方面的法律法規尚有待進一步健全,這在很大程度上抑制了工業大數據應用的廣度和深度,不利于工業大數據生態系統的建設和培育。
2.基于工業大數據的企業管理理念和運作模式變革
隨著智能設備、物聯網技術、智能傳感器、工業軟件以及工業企業管理信息系統等在工業企業的廣泛應用,綜合利用各種感知、互聯、分析以及決策技術,通過實時感知、采集、監控現場制造加工狀況、物流情況、生產準備情況、技術狀態管理情況,并開展數據挖掘分析,急需工業大數據平臺和相關技術的支撐。
工業大數據應用目的是推動工業企業基于對內外部環境相關數據的采集、存儲和分析,實現企業與內外部關聯環境的感知和互聯,并利用工業大數據分析技術開展挖掘分析,支撐工業企業基于數據進行決策管控,提升企業決策管控的針對性、有效性。
3.工業大數據人才缺乏制約產業發展
工業大數據技術應用的關鍵是揭示各種典型工業應用場景下,各種數據的內在關聯關系,因此,工業大數據技術的應用者不但要掌握工業大數據的相關知識和工具,還需要深刻了解制造業典型業務場景,并結合工業大數據的分析和可視化展示情況,結合業務場景進行合理解讀,此外,還需要結合業務場景進行解決方案的制訂和管理決策,以上工業大數據人才的要求將大大制約工業大數據產業發展進程。
整體上,工業大數據對復合型人才的能力需求更強烈,目前我國工業大數據的高級管理決策人才、數據分析人才、平臺架構人員、數據開發工程師、算法工程師等多個方向均存在較大缺口,極大阻礙了工業大數據產業的發展。
工業大數據技術和應用的四大發展趨勢
1.工業大數據應用的外部環境日益成熟
以工業4.0和工業互聯網為代表的智能化制造技術已成為制造業發展的趨勢,智能化制造技術的研究和應用推動了工業傳感器、控制器等軟硬件系統和先進技術在工業領域的應用,智能制造應用不斷成熟,一方面正在逐步打破數據孤島壁壘,實現人與機器、機器與機器的互聯互通,為工業數據的自由匯聚奠定基礎,另一方面進一步增強了工業大數據的應用需求,使得工業大數據應用的外部環境日益成熟。
2.人工智能和工業大數據融合加深
工業大數據的廣泛深入應用,離不開機器學習、數據挖掘、模式識別、自然語言理解等人工智能技術清理數據、提升數據質量和實現數據分析的智能化,工業大數據的應用和安全保障都離不開人工智能技術,而人工智能的核心是數據支持,工業大數據反過來又促進人工智能技術的應用發展,兩者的深度融合成為發展的必然趨勢。
3.云平臺成為工業大數據發展的主要方向
工業大數據云平臺是推動工業大數據發展的重要抓手。傳統的互聯網大數據處理方法、模型和工具難以直接使用,增加了工業大數據的技術壁壘,導致工業大數據解決方案非常昂貴,云平臺的出現,為工業企業特別是中小型工業企業隨時、按需、高效地使用工業大數據技術和工具提供了便宜、可擴展、用戶友好的解決方案,大大降低了工業企業擁抱工業大數據的門檻和成本。
4.工業大數據將催生新的產業
除了云平臺,新的大數據可視化和自動化軟件也能大大簡化工業大數據的數據處理、分析過程,打破了大數據專家和外行之間的壁壘。這些軟件的出現使得企業可以自主利用工業大數據,做相對簡單的工業大數據分析,以及外包復雜的工業大數據應用需求給專業工業大數據服務公司,從而催生新產業,包括工業大數據存儲、清理、分析、可視化等相關的軟件開發、外包服務等。
國防大數據:搶占未來戰爭制高點的基石大數據時代的國防建設需要新的國防戰略思想體系來指導。未來作戰是各軍種一體化行動的聯合作戰,國防大數據生之于此,并可以更好地為未來聯合作戰服務。
國防大數據是大數據在國防與軍事領域的應用,是保衛國家主權、統一,領土完整和安全而展開的軍事活動所生成的各種數據資源,是綜合了國防和大數據的需求,表現了國防大數據主要的內涵和特點。
國防大數據要求處理數據更高效、數據來源更可靠、數據安全系數更高,注重將重大國防和軍事任務進行數據融合,注重信息防御和數據安全管理,例如國防動員數據、軍事情報、戰場的實時動態、武器使用維護數據等。掌握國防與軍事大數據的優勢,才能打贏未來信息化戰爭,真正地把握未來戰場的主動權。
與傳統的大數據概念相比,國防大數據綜合了大數據定義和國防應用需求,它具有大數據的一般特征,又具有其獨特的軍事特性。歸納起來,它繼承了傳統大數據“4V”特點,又具有其獨特的“6S”特性。
從規模(Volume)上講,大量的國防大數據研發項目提供了豐富的情報來源,隨著現代數據獲取手段和能力的提高,國防數據已經達到了PB級規模;
從種類(Variety)上說,國防數據包括國防戰略數據、國防動員數據、國防科技數據、軍事訓練數據、裝備保障數據等多種類型的數據,包含文本、圖像、視頻、音頻、光電信等多種表現形式,種類混雜、處理難度高;
從速度(Velocity)上看,各類傳感器、雷達、衛星產生的高速數據流,相比當前民用數據管理系統,寫入速度大大加快;從數據價值(Value)方面分析,國防大數據對于國家安全、作戰指揮、軍事訓練、行動決策、裝備保障、軍事人力資源管理等方面起著至關重要的作用。
一是超復雜性(SuperComplexity),國防大數據涉及面廣、種類多樣、信息維度高、冗余度大,分析處理難度遠大于民用大數據;
二是超保密性(SuperSecrecy),軍用數據直接關乎國家的安全,是敵方竊取的重點,需要更安全高效的保障;
三是高機動性(SpeedDeployment),當前戰場形勢瞬息萬變,戰場環境復雜,國防大數據應具備陸海空天電網空間靈活調配和互聯互通的能力;
四是高安全性(Security),國防大數據在處理、存儲過程中更多地考慮是否遭受打擊等問題,因此其環境保障能力應較強;
五是強對抗性(StrongCountermeasures),國防大數據在情報偵察、武器控制、軍事訓練等方面體現了非合作的特征,也時常出現數據偽裝欺騙、數據非法竊取等現象;六是強實時性(Sooner),戰場機會稍縱即逝,處理數據速度越快、指揮鏈越短,越能更快地搶占先機,贏得戰爭的勝利。
習近平主席曾在網絡安全和信息化會議上指出:沒有信息化就沒有現代化,沒有網絡安全就沒有國家安全,要制定實施國家網絡安全和信息化發展戰略、宏觀規劃和重大政策,不斷增強網絡安全保障能力,信息技術十分重要,在國防軍事領域運用大數據技術勢在必行,也是實現中國夢、強軍夢的具體戰略舉措。因此,在數據日益開源的情況下,充分利用國防大數據的價值,對于國防和軍事現代化建設具有重大意義。
首先,大數據是制訂國防和軍事戰略計劃的基礎,構建國防和軍事大數據技術平臺,是科學制定國家戰略的重要環節。大數據的重要特點之一是全數據,而不是樣本數據,建立國防大數據倉庫,可以詳細記錄和獲取國防和軍事領域所需要的全部數據,避免出現以偏概全的情況;通過對大量數據采集、分析、處理和配置,結合人工智能、計算分析等方法挖掘分析,可以發現有價值的規律,完成科學的預測,幫助制訂合理有效的國防戰略規劃。
其次,大數據是進行信息化戰爭研究的重要手段,在戰場情報獲取、作戰指揮決策等方面能夠發揮重要作用。對戰爭的傳統研究模式可以感知交戰過程和作戰結果,卻無法模擬復雜多變的戰場態勢,無法呈現戰爭內在的關聯和規律。運用大數據分析技術可以對各渠道得來的海量信息進行實時化、智能化處理和仿真模擬,更加科學地分配兵力兵器,形成高效的打擊方案。
最后,大數據是打破體系內壁壘的有效方法。我軍剛剛進行了一體化聯合作戰的改革,很多體制機制還不健全,原有的各軍兵種之間的差異和壁壘很大。此前,各軍兵種之間各自為戰,各自擁有自主的指揮平臺,沒有實現互聯互通,數據規模不等、格式不一、質量各異,無法實現共享。通過大數據加強一體化指揮作戰平臺的建設和數據共享,加強各基層部隊搜集數據、存儲數據、共享數據的意識,可大大提高體系作戰能力。
當前,依靠經驗直覺進行作戰指揮的優勢正在急劇下降,大多數軍事強國已經認識到利用國防大數據的意義,將大數據技術作為國防科技發展的重要方向。美軍投入巨額資金,確定了“數據支持決策、彈性系統設計、網絡空間戰、電子戰與電子防護、反大規模殺傷性武器、自主系統和人工系統”等重點研究領域。對于我國來說,加強國防軍事數據的發展建設也刻不容緩。充分利用國防大數據的潛在價值,樹立大數據理念、完善制度機制、加強數據專業技術人才培養、構建大數據決策支持系統,對推動我國國防和軍隊建設具有重要的戰略意義。
金融大數據將成為宏觀決策和監管的新工具目前業內的金融大數據強調在微觀層面的應用,例如評價消費者的信用風險、支持投資決策、識別金融主體的身份等。隨著大數據分析和挖掘技術的不斷提高,微觀的金融大數據可以經過整合、匹配和建模,來支持宏觀的金融監管和決策。傳統的金融監管和決策以定性為主,輔助以簡化的量化指標,對實際情況缺乏充分的把握,而大數據技術可以充分利用底層的細粒度的微觀數據,整合分散的信息,融合不同維度的信息,帶來具有及時性、前瞻性和更為準確的決策支持,提高監管水平和決策能力。本節將以金融系統性風險管理、銀行存款保險費率的計算、對欺詐交易的檢測和經濟結構變化四個方面為例介紹金融大數據在宏觀金融決策和監管中的應用。
(一)金融關聯的系統性風險管理
金融危機之后,全球金融市場的關聯性遠勝于過去。市場的互動性一旦大大加強,就會導致流動性風險和系統性風險,造成市場恐慌。國內的信貸擔保圈(多家企業通過互相擔保或聯合擔保而產生的特殊利益群體)就是金融關聯的典型代表。由于信貸市場的發展,關聯的企業越來越多,互相形成擔保圈,甚至形成一張巨大的網。在經濟平穩增長期,擔保圈會降低中小企業融資的難度,推動民營經濟的發展。然而,一旦經濟下行,擔保圈就會顯露其負面影響——加劇信貸風險。如若處理不當,極易引發系統性金融風險。過去幾年,在南方企業擔保流行的省份,往往一家企業出現信貸不良,一群企業遭殃,一個行業陷入泥潭,整個地區面臨系統性風險,一些本來毫不相干,資金鏈正常,經營良好的企業也由于擔保關聯,跌入破產的深淵。
信貸市場擔保圈問題一度愈演愈烈,傳統的擔保圈分析方法對理解、處理擔保圈問題作用有限。企業之間擔保貸款本來是一種中性的信用增進方式,恰當地使用會產生風險釋緩作用,由于擔保圈風險迭出,銀行和監管部門把問題歸結到擔保貸款本身,目前各家銀行采取了比較嚴格的限制條款來避免擔保貸款的發生。
任何信貸產品都存在風險,金融機構本身就是經營風險的專業機構。本文的研究認為,從專業角度來說,擔保圈風險發生的根本原因,是缺乏合適的風險管理工具,沒有對擔保圈進行正確的風險管理。
目前對于擔保圈的量化風險分析存在以下問題。
首先是缺乏擔保圈全量的大數據,沒有足夠的信息支撐。各家銀行和當地的監管機構只有局部的企業擔保關聯數據,構不成完整的擔保圈視圖,風險信息有缺漏。無法了解整個擔保圈相關企業的詳細信息,因此處理具有系統性風險特點的擔保圈風險具有很大的局限性。
其次是無法對擔保圈風險進行建模,對風險進行正確的量化描述。傳統的風險分析工具都是對單個企業進行風險建模,適合對企業的貸款金額、貸款質量以及信貸行為建模,對于企業之間的關聯關系無法進行量化描述和風險分析。
因此我國有必要借助大數據的復雜系統分析方法,啟動對擔保圈的深入分析,為化解因擔保圈引發的金融風險創造條件。要考慮到如下條件:一是央行征信系統已收集了大量豐富的企業擔保關系數據。截至2015年底,中國人民銀行征信中心為2146萬企業建立了信用檔案,有信貸記錄的企業超過596萬家,關聯關系信息(僅限于有貸款卡的用戶)超過2億條。二是復雜網絡技術已日趨成熟。復雜網絡是由數量巨大的節點(研究對象)和節點之間錯綜復雜的關系(對象之間的關系)共同構成的網絡結構。復雜網絡分析技術針對越來越多、越來越復雜的事物之間的關聯關系進行非線性建模,可以較好地解決大數據的數據量(Volume)、數據復雜程度(Variety)和處理速率(Velocity)等基本問題。
隨著金融市場的創新和發展,金融風險變得越來越復雜,需要更多的數據支撐和復雜的數學模型來量化描述,大數據技術將成為未來金融風險管理的利器。
(二)銀行存款保險費率的計算
2015年5月,作為金融市場化進一步深入的重大舉措,銀行存款保險制度正式開始實施,這不僅有利于穩定宏觀金融,也對利率市場化后商業銀行的穩健經營和有序競爭有利。存款保險費率的厘定是存款保險制度的一個核心,而保費的估算是設計存款保險方案中的難題之一。保費結構的設計,在很大程度上決定了存款保險對于參保銀行的可接受度。想降低道德風險并減少逆向選擇,取決于合理的保費結構。國內對于銀行存款保險的研究以定性為主,對保險費率計算的量化分析比較欠缺。
從國外信貸數據的應用情況來看,信貸數據有助于銀行監管者準確評估監管對象的信用風險狀況。對于建立了公共征信系統的國家來說,風險分析技術可以成為有效的監管工具,由于銀行業的危機通常和高的不良貸款率相關,信貸數據常常用于信貸市場監控和銀行監管,是銀行監管統計數據的補充。因此,央行信貸大數據不僅可以幫助商業銀行管理信用風險,還可以支持監管和宏觀經濟分析。未來的研究可以利用信貸大數據,基于預期損失模型來計算銀行存款保險費率,從最基礎的信貸數據單元開始計算,給保費制定提供更加及時、準確的決策支持。
(三)進行精細化的金融監管
技術進步加上日益復雜的市場,會使得金融監管機構的工作變得艱難復雜,但大數據技術的發展提供了化解之道,讓金融市場維持良性運轉成為可能。如金融監管機構正利用計算和“機器學習”算法的最新進展,掃描金融市場信息和公司財報,從中找出欺詐或市場濫用行為的蛛絲馬跡。這些基于大數據分析技術的新型監管工具是金融交易欺詐偵查的未來,有越多的數據積累,其功能就將越強大。美國證交會幾年前就推出了一個被稱為“機械戰警(Robocop)”的計算機程序(學名“會計質量模型”),用證交會的金融數據庫檢查企業利潤報告,從中搜尋可能隱藏的異常行為——激進的會計手法或赤裸裸的欺詐。“機械戰警”的具體情況、手法,透露給外界的信息甚少,但其基本思路是:通過大數據分析,發現多個可能暗示著潛在會計問題的重要指標。
(四)觀測產業結構調整的新角度
金融大數據的深入挖掘還可以反映宏觀經濟變化的規律。例如,可以通過信貸大數據來觀測產業結構的調整。截至2015年底,2146萬戶企業及其他組織被收錄進企業征信系統,有596萬戶擁有信貸記錄,該系統累計提供信用報告查詢服務6.1億次。該系統數據有三大特點:
一、全面,數據采集覆蓋了國內絕大部分金融機構;
二、真實,所采集數據來自金融機構實際發生的每筆信貸業務,統計結果得自每筆業務數據匯總相加,數據可追溯從而可還原每筆明細;
三、時間跨度長,企業征信系統始自銀行信貸登記咨詢系統,2005年起提供對外服務,已運行了十年有余,意味著系統收集的數據超過十年,因此,對于分析國內企業的行業行為和行業情況很有價值。例如可以將這些賬戶級的信貸數據,逐層整合成企業級和行業級,利用大數據挖掘、分析,從信貸市場角度剖析產業結構的變化。
藍皮書指出,金融大數據分析可以成為宏觀金融決策和監管的有力工具,可以在市場化金融發展的過程中發揮重要的作用。與微觀金融大數據的應用方面很多金融科技公司沒有足夠的金融大數據的情況不同,國內的金融大數據都掌握在政府和監管部門的手中,金融大數據的宏觀應用有著良好的數據條件,更容易見到成效。
旅游大數據將支持智慧旅游城市建設加快推進藍皮書指出,大數據城市建設,核心是要打破信息壁壘,通過信息共享互通,提高效率,將一個個“信息孤島”有效地串聯起來,將信息高速公路轉化為現實的產業生態體系建設,形成“線上一條路,線下一個圈”的線上線下聯合發展模式,充分體現出“智慧”的特點。依托旅游大數據,形成以智慧城市基礎設施為依托,以各級旅游集散中心為樞紐,以旅游大數據平臺為信息中樞,以智慧旅游技術產品應用為媒介的分析系統,為旅游者提供導航、導游、導覽、導購的全程式旅游服務。同時,通過基于大數據“云+端”的架構處理,確保旅游監管系統、旅游信息發布系統、景區管理系統數據的統一。例如遵義市重點開發了旅游資源基礎數據庫和旅游大數據分析系統,并在景區的游客中心、賓館飯店大堂、大型商場影院、機場、汽車站、火車站等客流密集區或重要節點安裝智慧旅游多媒體查詢顯示屏。通過這種面向市場一線的架構處理,監管部門可確保多種系統運營的同步性、統一性和即時性。
旅游大數據平臺可以收集互聯網,例如論壇、博客、微博、微信、電商平臺、點評網等有關旅游評論數據,通過網評大數據庫進行分詞、聚類、情感分析,了解游客的消費習慣、價值取向,從而全面掌握旅游目的地的供需狀況及市場評價,為政府和涉旅企業做決策提供依據。如百度大數據產品百度預測已初步具備類似功能,可以預測景區未來兩日的人流及舒適度,為游客出行提供指導。
大數據為什么這么火?真相即簡單又粗暴,因為我們人多!
一些業內觀察人士認為,龐大的人口基數與多樣化的智能終端才是中國人工智能(Artificial Intelligence,AI)領域的優勢。也正因為如此,大數據、 智能制造、云計算、 智能金融、 模擬識別為中國AI市場最受關注的細分領域。
數據說明問題。2010年以來,國內大數據領域共發生近400起投資事件。
海外市場沒人怎么辦?資本投什么?
答案也很有意思。海外市場中,最吸引VC/PE機構的垂直細分領域是機器學習、智能機器人(21.95 +2.95%,診股)、自然語言處理等。它是人工智能的核心,也是使計算機具有智能的根本途徑,其應用遍及人工智能的各個領域。
國內AI偏愛大數據
在AI領域,業界觀察人認定,龐大的人口基數與多樣化的智能終端才是我們的優勢。
也正因為如此,大數據、 智能制造、云計算、 智能金融、 模擬識別為中國AI市場最受關注的細分領域。根據清科集團私募通統計2010年以來大數據領域共發生近400起投資事件。
除此之外,VC/PE機構頗為關注的還包括智能制造(機器人,無人機等)、自動駕駛汽車等等。
海外資本鐘情機器人學習
眾所周知,人工智能包含十分廣泛。自打誕生以來,其理論和技術日益純熟,應用領域也不斷延展。那么信息技術不斷更迭的當下,哪一項才是人工智能領域的最火分支?
清科集團研究結果顯示,海外市場中,最吸引VC/PE機構的垂直細分領域是機器學習、 智能機器人、自然語言處理等。其中,機器學習更是“熱中之熱”,2017年1~4月500余家與機器學習相關的企業獲得股權融資,涉及融資金額超過60億美元。
什么是機器學習?
通俗一點的理解是,“計算機有能力去學習,而不是通過預先準確實現的代碼”。或者理解為,專門研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的性能。
機器學習的熱度與其舉足輕重的地位相關。它是人工智能的核心,也是使計算機具有智能的根本途徑,其應用遍及人工智能的各個領域。
始于2015年的爆發
2015年是AI領域爆發式增長元年。
那一年,活躍在中國大陸的VC/PE機構、互聯網巨頭公司開始不斷加碼對AI領域的資本布局,當年全年投資案例從2014年的281起激增至719起,同比增長155.9%,投資總額從2014年的54.87億飆升至159.50億元(人民幣),同比增長190.67%。
業界觀察人士表示,2015年人工智能爆發其背后的主要原因是人工智能從技術上突破了產業大規模應用的瓶頸,如大數據、 云計算、 模擬識別技術(包括語音識別、 圖片識別等)以及一些人工智能應用層在智能化進程中取得了跨越式發展。
作為中國股權投資機構最受關注的領域之一,大量資本的進入必將進一步加深和拓寬人工智能在各垂直細分領域的在深度和廣度,人工智能全面改變現實生活的即將成為現實。
觀察相關數據可以很清晰的看到,2016人工智能領域延續了2015年高漲的投資熱情,而這種趨勢在2017年更是有增無減。
如果從區域分布觀察,國內AI企業也有集群效應,北京、 上海、 浙江、江蘇和深圳成為我國人工智能企業的聚集地,2010年~2017年5月這五個地區的投資案例有多達1801起,占全國總數八成以上。
內陸省份也有兩個小兄弟在努力追趕。已經有諸多跡象和案例顯示,VC/PE機構也對湖北和四川的人工智能企業很是認可。
偽AI企業需要警惕
按照屬性,人工智能可大致分為基礎層、技術層、應用層三類。
相對來講,AI技術層的投資周期長、成本高且風險大,所以投資機構普遍對AI應用層企業更有熱情,這類企業包括智能翻譯、醫療診斷、智能教育、智能投顧等,擁有著“看似低投入,變現快”的特征。
正如前文所講,2015年開始國內AI金融熱度飆升,催生出來的大量人工智能企業也存在魚龍混雜的情況。打著AI旗號大舉融資,AI“ 偽應用層” 蔓延滋生。
清科研究中心相關人士直言,國內真正意義上的AI企業仍屬少數派,大量應用層創業企業缺乏大數據、 云計算、 以及算法優化的支撐,企業缺乏核心競爭力。