12月13日是中關村大數據日。如果說2012年的首個中關村大數據日是在“布道”,那么,2013年的大數據日則是在唱一出產業“大戲”。2500人的會議室座無虛席,2013中關村大數據日匯聚了諸多大數據思想領袖、企業代表、技術先鋒和專家學者,共同探討包羅萬象的“大數據+”。觀風聽潮,2013中關村大數據日呈現的不僅是一場業界關于大數據的思想激蕩,一種關于大數據的智慧表達,更呈現了中關村大數據產業在潮頭昂首挺立,大步向前的姿態。
思潮篇
大數據:正在發生的未來
隨著智能終端進一步普及,數據采集逐漸多樣,智能分析逐漸成熟,云計算數據存儲和加工后臺開始就緒,一個數據新時代正在到來。
“大數據是正在發生的大事件,下一個大事件是大數據應用的涌現。”《大數據的云圖》作者、風險投資者大衛·芬雷布在2013中關村大數據日上預言,“下一個谷歌微軟級別的公司將在大數據領域出現。”
應用驅動發展
“過去幾年,風險投資者主要聚焦于大數據的基礎設施領域;接下來,大數據的應用將獲得重大發展,從而真正地把數據變成生產力。”大衛·芬雷布認為,大數據的下一個趨勢是各種關于大數據的應用不斷涌現,它們將出現在大數據與其他行業的交叉領域,比如大數據與教育、大數據與健康等。
“今天,一個嶄新的數據未來正在發生。”天云大數據首席執行官雷濤表示,隨著數據和計算模型放到了一起、全量的數據融合成了一體、知識發現的工作成為了基礎工作的一環,大數據實際上已經變成了一種基礎設施。對于企業來說,構建這樣一個基礎設施已成為完善企業信息化、探索企業數據價值、實現有競爭力的業務創新的根本;對于每個人來說,大數據正在改變人們生活和工作以及社會生產方式的各個方面。
醫療領域,越來越普及的可穿戴智能設備可以隨時隨地監測人們的身體數據,一場量化自我運動正在或者已經發生;每個人、每家醫院內部、醫院和醫院之間的電子病歷庫正在建立,通過分析歷史數據,醫生能更有針對性地治療病人,并且可以避免大量的重復檢查。個性化醫療正在逐漸形成。
金融領域,作為可以產生海量數據的行業,大數據正在改變著銀行、證券交易所、股票基金等機構的運作方式。通過將金融數據與互聯網數據綜合分析,可以為風險管理、金融分析、客戶價值挖掘與個性化定制服務、保險(放心保)定制、精準營銷等各個方面提供數據依據,做出正確決策,以減少市場波動和不確定因素對金融價格的影響。
電商領域,可以說是目前大數據的主要用武之地,主要表現為精準營銷或者個性化推薦。與過去相比,現在電商可以采集到更多更全面的用戶數據,根據用戶的上網行為、點擊行為和消費行為進行數據分析,得出更為精準的分析效果,從而制定更為精準的廣告營銷,或推出具有客戶潛在需求的產品,進一步擴大用戶群體及銷售,進而收集更多的用戶數據,形成一個良性循環。
除此之外,大數據與交通出行、商業、制造、教育等傳統行業都有交叉點,并正在改變其運作方式。一個更加數據化、智能化、個性化的未來正在到來。
公共數據資源待開放
大數據時代的競爭,將是數據資產的競爭。數據資產怎么獲得?這是大數據商用化進程中一個不可回避的問題。除了企業自身的積累乃至付費的購買以外,原先掌握在政府手中的公共數據資源究竟該如何獲得?答案就在“開放”二字。
“開放公共數據資源,并不等同于免費獲得。”中國計算機學會大數據專委會副秘書長潘柱廷強調,業界在承認公共數據價值的同時,應該用價值規律來考慮數據的合理使用。基于此,采用交易的方式來進行數據資源的分享也許更加可行,也更符合經濟規律。
“數據的共享要在一定的良性交易規則下進行,要盡量在共享和交易之間找到一個合適的方法。”潘柱廷認為,公共數據資源的開放,也需要一定的標準和規范來加以約束。哪些公共數據資源可以開放,如何開放?這都是需要深入考慮的問題。其中,對于那些涉及信息安全的數據,一定要盡最大可能給予保護;對于那些有可能涉及個人隱私的數據,要經過處理,例如封裝之后才能開放。
“目前政府部門所掌握的公共數據,能夠開放的已經在逐步開放之中,例如工商數據以及車輛信息等。” 中關村管委會副主任宣鴻表示,“政府有責任推動法規、標準,以及數據交易平臺、市場的建立,以推動大數據的應用。”
“希望政府將大數據充分運用到醫療、教育、交通等智能城市的建設當中。”太極集團總裁劉淮松、榮之聯總裁王東輝等企業界代表在圍繞大數據政策展開討論時強調,大數據不能稱之為一個行業,它植根于各行各業當中,應利用此特點進一步將產業上下游連接起來,推動“數據新世界”早日到來。
中關村大數據潮起
大數據是人類社會發展、科技與產業創新的一次偉大變革。未來大數據產業將成為新科技和產業革命的重要引擎,孕育著巨大的商業價值和社會價值。有機構預測,2014年全球在大數據和服務上的開支將上漲30%,超過140億美元。
宣鴻介紹說,中關村國家自主創新示范區作為中國的“硅谷”,率先布局大數據產業,并將大數據產業納入《中關村戰略性新興產業集群創新引領工程(2013-2015年)》。2012年,中關村大數據產業聯盟正式成立。同時,2012年中關村大數據日發布的云天使基金、中云融匯基金、大數據實驗室孵化基金三只產業投資基金經過一年的發展,已投資和扶持了數音堂、數據聯英等一批大數據創業企業。
“中關村是我國大數據企業聚集地和全球大數據創新創業的熱土,聚集了百度、京東、用友、浪潮、神州數碼、高德軟件等百余家國內龍頭企業,并實現了持續快速發展。”據宣鴻介紹,目前中關村大數據和移動互聯網產業的收入規模超過5000億元。來自硅谷等地區的留學人員在中關村創辦的企業已經累計超過6000家。
宣鴻表示,中關村已經逐步形成了與硅谷同步發展的大數據創新生態,大量的天使投資人和創業投資機構瞄準大數據創業者,每年發生的創投案例和金額都占到全國的1/3,其中近80%投資在信息技術領域。
談到中關村大數據產業的未來,宣鴻表示,將進一步鼓勵全球大數據研究機構和創業者到中關村開展創新活動;培育一大批大數據應用服務,打造大數據產業鏈和創新鏈;推動完善云計算和數據中心軟硬件設施的建設,將中關村打造成為全球大數據產業人才、技術、資本等創新要素和數據資源的匯聚地和全球大數據產業的重要創新中心。
案例篇
紛起的中關村大數據應用讓生活別樣精彩
大數據,讓城市智慧起來
12月10日晚,中央電視臺《新聞聯播》播發了一條智慧城市的新聞《借助大數據城市更“智慧”》,展示了張家港市建設市民服務中心,通過大數據技術的支撐,實現部門之間數據庫信息的互聯互通,實現城市的智慧管理。該平臺的開發單位就是中關村企業——神州數碼控股有限公司。
神州數碼相關負責人介紹,城市公共信息服務平臺就是立足城市,充分利用新一代信息技術,在解決當前各類問題的同時,能夠構建一套融合創新的機制,保障城市的健康可持續發展。
為此,神州數碼構建了一套獨有的“城市虛擬映像”體系。該公司相關負責人說,通過這個“城市虛擬映像”,可以將針對每個主體的應用服務抽取出來,形成對現實世界的服務。那么,如何構建“城市虛擬映像”?首先要抽取出城市的“主體”,比如市民是城市的一個重要主體,市民是一個自然人,圍繞自然人的各種要素抽取,建立一個“數字人”的模型,并通過從現實世界獲取的各項針對這個人的非結構化數據,進行數據清洗、關鍵數據抽取,形成一個人的數字映像關系,從而實現非結構化數據的重組。針對現實的各項城市公共服務,就是在城市虛擬映像中形成的。
在“城市虛擬映像”的架構體系下,神州數碼完成了智慧城市公共信息服務平臺的構建。目前公共信息服務平臺2.0版包含了市民融合服務平臺、企業融合服務平臺和城市管理服務平臺3個平臺。
大數據,助力傳統產業升級
大數據這一“新式裝備”如何提升傳統產業,如何助推企業轉型升級?大數據的利用隨處可見。比如,水產養殖業,可通過分析大量傳感器、環境、市場、客戶數據,逐步實現水產養殖的自動控制,并進一步指導市場營銷和產業布局等。
中關村管理軟件企業用友軟件公司相關負責人認為,對傳統企業來說,大數據的思想和技術對企業的管理提升具有更多的現實指導意義,大數據在傳統企業的應用中體現更多的是催生出一些新的工作模式、商業模式和新型的企業文化。
目前,用友軟件已經與很多傳統企業合作,助推企業轉型升級。例如,用友軟件為某大型燃氣公司搭建集成平臺,解決了該企業子公司多、無法集中管理等多重問題,為企業建立了全新的、系統的一體化平臺。再比如,采集銷售客戶數據用于指導市場營銷策略規劃;將員工對產品的評論意見進行爬蟲搜索、分類整理和分析,用來指導新一代產品設計;利用歷史銷售數據整體進行產品系列結構和配比模擬分析,結合客戶購買行為統計分析產品的銷售組合頻率,進行相應的產品捆綁組合促銷策略制定。
此外,用友軟件還為中國郵政儲蓄銀行建立起體系先進、數據集中、監管完善的管理系統,所有數據在財務管理系統中生成全行的報表和一本賬,搭建起全國大總賬,幫助銀行實現精細化、規范化、科學化管理的經營發展戰略。
大數據,讓交通盡在掌握
上班下班、出行游玩……交通成為人們不得不面對的問題,尤其是在北京、上海這樣的特大城市。大數據是如何應用于交通的?中關村交通信息領軍企業高德軟件有限公司提供了一套解決方案助力智能交通。
如果你想開車出門,但卻擔心交通狀況,怎么辦?高德推出了一個系統——全平臺的路況趨勢預測查詢,可以幫你預測路況,也可以幫你規劃更加合理的出行路線,以規避擁堵,而且該系統會給出到達目的地的預計時間。如果你已經出門了卻不知道前方路況怎樣,高德的新應用“前方路況播報”可以告訴你,你可以根據情況及時更改路線或做其他打算,省去不少麻煩。
為了更好地進行交通數據挖掘,分析個人出行的影響因素,高德推出了“基于大數據的道路速度海量通數據擬合”,將每條道路的歷史碎片速度信息記錄、存儲,通過進一步挖掘,為大數據技術實現交通預測和路徑規劃提供了依據和積累。
高德利用大數據這一利器,為公眾提供個性化的出行服務,以用戶大數據為驅動,達到改善產品體驗的目的。高德軟件相關負責人介紹,高德為公眾提供的服務可以歸納為通過對海量數據的實時分析處理,高頻度、高精度地發布城市交通路況,提供最真實的交通狀況;同時高德還在為改善城市交通管理水平、制定交通策略、宏觀交通決策提供依據而努力。
大數據,保障公共安全
3秒鐘鎖定嫌犯,這聽起來不可思議。但大數據應用于公共安全領域讓這成為可能。
乘坐同一班列車,住同一酒店的兩個人可能是同伙,刑偵人員將不同線索拼湊起來排查疑犯——來自于多源數據的處理在傳統架構上需要數小時甚至整日,而在北京亦莊云基地建立的天云大數據平臺將這一操作縮短至3秒,同時描述出疑犯的交往關系。公安人員可以基于計算出的線索盡快鎖定目標。
在公安機關的日常工作中,有大量的查詢需求,尤其是實戰中,各地各部門迫切要求實現跨地區、跨部門的信息快速查詢,需要獲得及時、全面、準確的信息支持,進而實現統計分析和關聯綜合利用。
如今,警務信息化正步入建設階段,公安“大情報系統”建設與應用可以將警務管理建立在動態的收集、分析、測繪犯罪信息的基礎上,實現預防和打擊犯罪的目的,其中精準的情報是基礎、有效的戰術是手段、警力及相關資源是保障。
大數據,服務金融創新
有媒體報道說,以數據分析幫助供應鏈中的小企業拿到銀行的信用貸款,金電聯行不小心撬動了中國的中小企業信貸革命。
中關村企業金電聯行(北京)信息技術有限公司將大數據應用于金融創新,基于大數據與云計算技術創建了“客觀信用評價體系”,技術載體為“數據挖掘機器人信用信息云服務平臺”,其金融創新業務集中體現在“大數據信用”。
“客觀信用評價體系”通過植入云端機器人對被評主體網狀與線性的海量、高速、多樣、易變的客觀信息,進行全自動、全天候的挖掘、分析與評價,提供非主觀的全計算性信用結果與實時的跟蹤評價,從而實現采集信息、運用數據、過程分析、評價結果和風險預警的客觀性、智能性和高效性。評估后會得出各個模塊的子因素評價結果,形成針對中小企業的信用分析報告。
“數據挖掘機器人信用信息云服務平臺”的數據采集模塊由“數據挖掘機器人”完成,數據分析模塊由“客觀信用評估體系”完成,并可以實現數據實時更新以完成追蹤監管。
通過“客觀信用評估體系”對企業信用做出分級和評價,可供銀行等金融機構作為授信的依據,使企業得到無抵質押、無擔保的信用貸款。
大數據信用是大數據與云技術在信用領域的一種創新性應用,它從認識上改變人們對信用的傳統觀念與信用評價思維,從模式上突破金融市場以抵質押和擔保貸款為主的傳統方式,以及我國社會信用體系建設中信用信息采集難、辨偽難、評價難、跟蹤難等困境,從一誕生就開始引發經濟與社會效應。
大數據,預測電影票房
大數據可以預測交通路況,同樣可以預測電影票房。新影數訊iFilm+利用社交網絡和數據挖掘預測票房,準確率可達85%。
2012年下半年電影《1942》上映前夕,外界對這部電影一片贊譽并看好,紛紛預測票房將突破7億元,新影數訊創始人劉晗卻在外出休假前發布了一條微博,斷言《1942》的票房不會超過4億元。電影的制片方甚至前來質詢:“你是哪個競爭對手派來"黑"我們的?”
電影上映后,劉晗的預測得到了印證。《1942》的票房最終收于3.6億元左右。這一預測結果究竟從何而來?劉晗首先確定出影響票房的幾個變量,如演員、檔期、上映時間、首映地等,接著就要推算出公式中的定量,他的做法是從1990年以來上映的電影中抽樣出四五百部,從統計年鑒中查到數據,然后讓計算機逆向推導出定量,從而確定公式。預測時再把社交網絡中反映出的變量填入公式后進行測算。
新影數訊每天處理上億條社交網站上網友對電影的評價信息、娛樂新聞等,每個季度都要追加新的服務器和硬盤以應對暴增的數據處理量,嚴格說來,他們賺的是數據的錢。不僅如此,新影數訊的另一個業務更前衛——為挑選演員甚至導演給出“數字上的建議”。如今,新影數訊已經和十幾家影視公司合作,為萬達娛樂、華策影視、小馬奔騰、光線傳媒等娛樂企業做營銷策略咨詢,更有香港、好萊塢的電影公司上門找他們做數據測算。新影數訊也獲得了海銀資本的投資,成為中關村雛鷹人才基地的一員。
大數據,讓搜索更容易
對于搜索大家并不陌生,中關村企業百度公司可謂是搜索引擎的龍頭老大。而這里要說的是另一家企業——北京拓爾思信息技術股份有限公司。
拓爾思憑借非結構化數據管理方面和海量信息處理方面的突出優勢,推出了“平臺+行業解決方案+服務”的綜合產品線,把海量非結構化信息處理技術和Hadoop架構進行有效集成,結合企業在大數據采集、管理、分析挖掘、可視化方面的具體需求,針對企業數據、機器數據、社會化數據,以TRS海貝大數據管理系統為平臺支撐,推出了TRS機器數據挖掘引擎、TRS社會媒體分析云服務和TRS大數據一體機等相關產品和全面的解決方案,滿足政府和企業在大數據時代對數據分析、管理的新需求。