數據是大數據時代的基礎性資源,作為國內互聯網產業的發源地和創新高地,中關村聚集著工業和信息化部、交通運輸部、公安部等20多個部委信息中心,中國移動、中國電信及中國聯通3大電信運營商,百度、京東、搜狐等國內大型互聯網平臺公司,清華、北航、中科院、微軟研究院等國內外頂尖高校及科研院所,以及龍信數據、用友軟件等百家大數據從業機構,具有高價值密度數據,擁有全國最大規模和最有價值的數據資產,成為中關村大數據產業發展得天獨厚的優勢。依托下一代互聯網、移動互聯網和新一代移動通信、衛星應用產業集群,中關村“大數據”精彩故事正在上演。
作為我國信息產業的策源地,中關村在全球率先布局大數據產業,打造完整產業鏈,不斷完善產業鏈各環節,做大做強一批龍頭企業,促進新一代信息技術產業創新鏈互動和融合發展,為催生新的經濟增長點、保障國家信息安全、加快工業和信息化的深度融合做出重大貢獻。
風起云涌,“大數據”的浪潮正席卷中關村這塊創新高地……
神州數碼:讓城市智慧起來
讓我們來看下大數據是如何應用于城市管理的。12月10日晚上,中央電視臺《新聞聯播》播發了一條智慧城市的新聞,《借助大數據,城市更“智慧”》,展示了張家港市建設市民服務中心,通過大數據技術的支撐,實現部門之間數據庫信息的互聯互通,實現城市的智慧管理。此平臺的開發者就來自中關村——神州數碼控股有限公司。
從聯想集團分拆出來的神州數碼公司,致力于整合全球信息產業資源,2010年提出了“智慧城市”戰略,通過以云計算、移動互聯、物聯網為代表的信息技術手段進行融合創新,推進中國新型城市化進程。
神州數碼負責人介紹,智慧城市,實際上就是圍繞城市、城市的市民、經濟組織、城市運營管理者等主體而產生的智慧化應用服務。智慧城市已經成為經濟社會大轉型升級中的有效抓手,智慧城市的建設要靠“城市公共信息服務平臺”來進行系統支撐。
城市公共信息服務平臺,就是立足城市,充分利用新一代信息技術,在解決當前各類問題的同時,能夠構建一套融合創新的機制,保障城市的健康可持續發展。
為此,神州數碼構建了一套獨有的“城市虛擬映像”體系。通過這個“城市虛擬映像”,將針對每個主體的應用服務抽取出來,形成對現實世界的服務。如何構建“城市虛擬映像”呢?首先要抽取出城市的“主體”,比如市民是城市的一個重要主體,市民是一個自然人,圍繞自然人的各種要素抽取,建立一個“數字人”的模型,并通過從現實世界獲取的各項針對這個人的非結構化數據,數據清洗、關鍵數據抽取,形成一個人的數字映像關系,從而實現非結構化數據的重組。針對現實的各項城市公共服務,就是在城市虛擬映像中形成的。
這一架構的優勢在于城市的虛擬映像是穩定的,而城市服務的需求是多樣的,構建了這樣一個穩定的城市虛擬映像,就可以隨時根據需求,開發出不同目的、不同主體的公共信息服務應用。在城市虛擬映像中,實現了數據的交互融合,也就實現了城市管理過程中綜合調度管理的基礎。
在城市虛擬映像的架構體系下,神州數碼完成了智慧城市公共信息服務平臺的構建。目前公共信息服務平臺2.0版包含了市民融合服務平臺、企業融合服務平臺和城市管理服務平臺三個平臺。目前,神州數碼“智慧城市”戰略布局在全國70多個城市展開,并與近20個城市簽訂了戰略合作框架協議,已經成為中國市場領先的“中國智慧城市專家”。
用友:
用好“大數據”,提升產業升級
大數據這一“新式裝備”,如何來提升傳統產業、進行轉型升級?只要你想得到、用得上,大數據的利用將隨處可見。比如,大數據與用水產養殖,可通過分析大量傳感器、環境、市場、客戶數據,逐步實現水產養殖的自動控制,并進一步來指導市場營銷和產業布局等。
中關村管理軟件企業——用友軟件公司負責人認為,對傳統企業來講,大數據的思想和技術對企業的管理提升具有更多的現實指導意義,大數據在傳統企業的應用中體現更多的是催生出一些新的工作模式,商業模式和新型的企業文化。
目前,用友公司已經與很多傳統企業合作,助推企業轉型升級。例如,用友為某大型燃氣公司搭建集成平臺,解決了此企業子公司多、無法集中管理等多重問題,為企業建立了全新的、系統的一體化平臺。再比如,為采集銷售客戶數據用于指導市場營銷策略規劃,將員工對產品的評論意見進行爬蟲搜索、分類整理和分析,用來指導新一代產品設計;利用歷史多年銷售整體數據進行產品系列結構和配比模擬分析,結合客戶購買行為統計分析產品的銷售組合頻率,來進行相應的產品捆綁組合促銷策略指定。
此外,用友還為中國郵政儲蓄建立體系先進、數據集中、監管完善的管理系統,所有數據在財務管理系統中生成全行的報表和一本賬,搭建起全國大總賬,幫助銀行實現精細化、規范化、科學化管理的經營發展戰略。
高德軟件:
讓交通盡在掌握
上下班、出行游玩……交通成為我們不得不面對的問題,尤其是北京、上海這樣的特大城市。那么大數據是如何應用于交通的?讓我們來看下中關村交通信息領軍企業高德軟件有限公司是如何做的。
如果你想開車出門,但卻擔心交通狀況,怎么辦?高德推出了一個系統,叫全平臺的路況趨勢預測查詢,可以幫你預測路況,也可以幫你規劃下更加合理的出行路線,以規避擁堵,而且系統會給出達到目的地的預計時間。而如果你已經出門了,卻不知道前邊路況怎樣,高德的新應用“前方路況播報”可以告訴你,你可以根據情況及時更改路線或做其他打算,省去不少麻煩。
高德通過搜集的海量行業數據,為大數據技術提供了用武之地,這其中有來自出租車、物流車的行業浮動車數據,用戶生成的眾包數據,經匯總、處理后生成反映實時道路路況的交通信息。通過大數據挖掘,可以為公眾的各種使用場景,提供預測性的、具有指導性的、個性化的交通信息服務。
為了更好地進行交通數據挖掘,分析個人出行的影響因素,比如特定道路的擁堵規律、交通水平,以及工作日或節假日影響、天氣影響的擁堵水平波動等,高德更是先進地推出了“基于大數據的道路速度海量通數據擬合”(高德SpeedProfile),將每條道路的歷史碎片速度信息記錄、存儲,通過進一步挖掘,為大數據技術實現的交通預測和路徑規劃提供了依據和積累。
高德利用大數據這枚利器,為公眾個體提供了個性化的出行服務,以用戶大數據為驅動,達到改善產品體驗的目的。特別針對車主群體,通過對歷史數據的分析,為每條道路的通行狀態建模,分析出車主在不同時刻的行程真實耗時分布。其次,通過海量的最真實的統計,為出行提供決策分析;通過建立道路通行時間、路口等待時間數據庫,為導航規劃提供更有價值的參考,為用戶規劃最高快捷的道路,利用海量軌跡數據,針對重要居民區和重要辦公區、商圈的公眾通勤導航數據,推出了車主最常走的“黃金路線”,體現了根據駕車人經驗的、大數據實現的路線推薦的真實價值。
高德作為交通信息領軍企業,在采集和融合行業數據方面,具有深厚的服務和運營經驗。目前,高德提供的交通信息服務覆蓋城市超過50個,訪問用戶超過1億,日訪問用戶量80萬,日使用時長21.8分鐘,在服務內容和用戶量都達到一定規模和社會影響力;截至目前,累積公眾用戶量超過一億,5月覆蓋道路里程1.47億公里,為高德的城市交通路況大數據分析奠定了數據基礎。
云基地:
用“大數據”保障公共安全
3秒鎖定嫌犯,這聽起來不可思議。但大數據的應用于公共安全領域,讓這成為可能。
乘坐同一班列車,住同一酒店的兩個人可能是同伙,刑偵人員將不同線索拼湊起來排查疑犯,可是來自于多源數據的處理在傳統架構上,需要數小時甚至整日。在北京亦莊云基地建立的天云大數據平臺,將這一操作縮短至3秒,同時描述出疑犯的交往關系。公安人員可以基于計算出的線索流暢的思考。
在公安日常工作中,對于人口、違法犯罪、出入境、酒店網吧信息、車輛駕駛員、在逃人員、被盜搶車輛等信息有著大量的查詢需求,尤其是實戰中,各地各部門迫切要求實現跨地區、跨部門的信息快速查詢,需要獲得及時、全面、準確的信息支持,進而實現統計分析和關聯綜合利用。
如今,警務信息化引領公安整體工作和隊伍建設正步入建設階段,公安“大情報系統”建設與應用可以將警察管理和警察行動建立在動態的收集、分析、測繪犯罪信息的基礎上,實現預防和打擊犯罪的目的,其中精準的情報是基礎、有效的戰術是手段、警力及相關資源是保障。
新影數訊:
預測電影票房的“法寶”
大數據可以預測交通路況,同樣可以預測電影票房。新影數訊iFilm+利用社交網絡和數據挖掘預測票房,據稱準確率可達85%。
2012年下半年電影《1942》上映前夕,在外界對這部電影一片贊譽和看好,紛紛預測票房將突破7億元時,新影數訊創始人劉晗卻在外出休假前發布了一條微博,斷言《1942》的票房不會超過4億元。電影的制片方甚至前來質詢:“你是哪個競爭對手派來‘黑’我們的?”
電影上映后,劉晗的預測卻得到了印證。《1942》的票房最終收于3.6億元左右,和自己團隊的預測結果幾乎相差無幾,僅僅達到了制片方目標和業界預測值的一半多一點。
預測結果,究竟從何而來?他首先確定出影響票房的幾個變量,如演員、檔期、上映時間、首映地,接著就要推算出公式中的定量,他的做法是從1990年以來上映的電影中抽樣出四五百部,從統計年鑒中查到數據,然后讓計算機逆向推導出定量,從而確定公式。預測時再把社交網絡中反映出的變量填入公式,進行測算。
新影數訊每天處理上億條社交網站上網友對電影的評價信息、娛樂新聞和明星八卦等,每個季度都要追加新的服務器和硬盤以應對暴增的數據處理量,嚴格說來,他們掙的是數據的錢。
不僅如此,新影數訊的另一個業務更前衛——為挑選演員甚至導演給出“數字上的建議”。根據歷史參數和社交網絡上的數據分析來給出判斷。“很多導演挑選演員是根據經驗,而你只要告訴我要找什么類型的角色,系統就會根據演員的外形和之前對類似角色的演繹效果給出匹配。”
如今,新影數訊已經和十幾家影視公司合作,為萬達娛樂、華策影視、小馬奔騰、光線傳媒等公司做營銷策略咨詢,更有香港、好萊塢的電影公司上門找他們做數據測算,公司也獲得了海銀資本的投資,成為海淀區中關村雛鷹人才基地的一員。
拓爾思:讓搜索更容易
搜索,大家并不陌生,中關村企業百度公司做搜索引擎可謂龍頭老大。而這里要說的是另一家企業,北京拓爾思信息技術股份有限公司。
拓爾思憑借非結構化數據管理方面和海量信息處理方面的突出優勢,推出了平臺+行業解決方案+服務的綜合產品線,把海量非結構化信息處理技術和Hadoop架構進行有效結合集成,結合企業在大數據采集、管理、分析挖掘、可視化方面的具體需求,針對企業數據、機器數據、社會化數據,以TRS海貝大數據管理系統為平臺支撐,推出了TRS機器數據挖掘引擎、TRS社會媒體分析云服務和TRS大數據一體機等相關產品和全面的解決方案,滿足政府和企業在大數據時代對數據分析、管理的新需求。
TRS海貝大數據管理系統是拓爾思大數據產品系列的核心產品之一,兼容Hadoop標準,融合搜索引擎技術,可實現對海量結構化和非結構化數據的搜索、分析和挖掘,發揮平臺性的支撐作用。
TRS機器數據挖掘引擎是面向物聯網、電子商務、醫療、電信、金融等領域,為了滿足大數據環境下的機器數據存儲、管理、檢索、分析、可視化等應用需求,推出的日志挖掘和用戶行為分析系統,可廣泛應用于IT運維、安全審計和用戶行為分析等方面。
TRS社會媒體分析云服務平臺是建立在TRS數據中心基礎上的大型在線服務平臺。可面向政府、企事業單位和個人,以在線云服務的方式提供信息監測、統計分析、關系挖掘、傳播效果評估等一系列服務,范圍涵蓋網絡媒體、論壇博客、微博SNS等全媒體,囊括了事前預警、事中分析、事后處理,為信息的全面分析構建了完整的生態鏈條。此平臺在大數據的智能挖掘、熱點分析方面具有業內領先的技術優勢,從復雜的社會關系中挖掘出有用的信息,并通過即買即用的在線方式為客戶提供必要而有效的應用。
拓爾思—華為信息檢索一體機是經深度優化和技術融合的高性能檢索服務器,支持自然語言及智能擴展檢索,提供結構化、半結構化和非結構化數據的聯合檢索。一體機設計了高可靠的體系架構,兼容國際主流技術標準,接口開放,支持PB乃至EB級大數據的精確搜索,能夠滿足用戶的高并發訪問,可為媒體、金融、政府、專利等行業或領域的企業級檢索提供高效的計算和支撐環境。
金電聯行:
服務金融創新
有媒體報道說,以數據分析幫助供應鏈中的小企業拿到銀行的信用貸款,金電聯行不小心撬動了中國的中小企業信貸革命。
中關村企業金電聯行(北京)信息技術有限公司,做的將大數據應用于金融創新,基于大數據與云計算技術創建了“客觀信用評價體系”,技術載體為“數據挖掘機器人信用信息云服務平臺”。其金融創新業務集中體現在“大數據信用”。
“客觀信用評價體系”,通過植入云端機器人對被評主體網狀與線性的海量、高速、多樣、易變的客觀信息,進行全自動、全天候的挖掘、分析與評價,提供非主觀的全計算性信用結果,與實時的跟蹤評價,從而實現了采集信息、運用數據、過程分析、評價結果和風險預警的客觀性、智能性和高效性。評估后,會得出各個模塊的子因素評價結果,形成針對中小企業的信用分析報告。
“數據挖掘機器人信用信息云服務平臺”,數據采集模塊由“數據挖掘機器人”完成,數據分析模塊由“客觀信用評估體系”完成,并可以實現數據實時更新以完成追蹤監管。云服務平臺的輸出端有多種形式的展示,滿足融資者、銀行等金融機構和政府部門的需求。整個評估過程實施全數據導入控制,實現了以數據作為貸前篩選、貸中審核、貸后監管的信貸全流程管理的唯一依據。
通過“客觀信用評估體系”對企業信用做出分級和評價,可供銀行等金融機構作為授信的依據,使企業得到無抵質押、無擔保的信用貸款。此產品主要針對核心企業上下游供應商融資,全面覆蓋采購、生產和銷售階段的全產業鏈融資,降低存貨和應收帳款對資金的占用。由于公司高效運行的技術體系支撐,此產品效率很高,貸款申請周期短(10-45天),申請成功率較高。迄今金電聯行已經為600多家中小企業提供了總規模近30億元的非抵質押信用融資服務,其中單筆最高信用額度達6800萬,未發生過一筆不良貸款。
金電聯行負責人表示,大數據信用的核心是數據,數據的開放尤為重要。據介紹,在金融服務領域,金電聯行正在為銀行等金融機構提供創新性的信用解決方案,尤其是貸前批量企業篩查,貸后風險量化監管,以及嵌入式的服務系統,創造出銀行信貸管理新模式。