IBM Insight 2015大數據分析峰會的最后一個演講是由寶信軟件研發部總經理董文生帶來的,時間雖然靠后,但是內容同樣精彩,在主題演講中,寶信帶來了另一個與民生密切相關的案例故事,那就是交通。
交通是城市發展的命脈,在各地智慧城市建設過程中,智慧交通都處于非常重要的位置。而想要管好交通,就要同時管好車和路。這就要用到近年大熱的一項技術——車聯網。車聯網通過各種信息傳感設備,利用RFID、GPS、移動通信、無線網絡等接入技術和網絡服務支撐技術,實現人、車、路、環境之間的智能協同,實現在信息網絡平臺上對汽車的屬性和靜動態信息,進行提取、利用并提供綜合服務。簡單說,車聯網的本質就是汽車通過移動互聯網與外界發生關系,從而提高效率,最終為人們的出行提供便利。車聯網技術可以打通車輛制造、銷售、服務、管理每個單元,達到對車輛的有效管理;而通過智能交通技術,特別是大數據與分析優化來管理套牌車輛監察、疏通擁堵,提升車輛通行效率。
傳統解決方案之困
介紹完背景,現在就來說說本文的主人公,寶信軟件與IBM大數據分析之間的故事。為保證新能源車的行駛安全,上海政府要求監控所有新能源車的行駛數據,而上海的新能源車監控中心正是由寶信軟件參與共建的。
據董文生介紹,目前,有1.75萬輛車的數據要進入該監控中心,到2017年,這個數字會上升到5萬輛。粗略地算一下,一臺車的監控點不少于70個,再乘以5萬臺,那么,兩年后該監控中心的收錄數據點將達到350萬點,且這些數據的匯報頻率都是秒級的。這給寶信軟件帶來了很大挑戰,因為,傳統解決方案大多使用集中式關系型數據庫,這種數據庫的存儲數據量無法不斷拓展,且對于一些新型數據,如地理位置數據、圖像數據,關系型數據庫也不能有效快速的支持。因此,如何搭建一個性能更好的后臺系統,保證上海新能源車監控中心在數據量激增的情況下,實時監控車輛數據就成了寶信軟件的緊要任務。
還有另一個大數據分析場景,那就是智能交通。據介紹,寶信軟件參與了很多上海和杭州市的智能交通系統項目,其中就包括卡口系統。卡口系統是對所有通過該卡口點的機動車輛進行拍攝、記錄與處理的一種道路交通現場監測系統,該系統可自動識別通過卡口的車輛號牌、顏色等特征,驗證出車輛的合法身份,自動核對黑名單庫,從而進行自動報警。
上海市約有270萬輛車,需要監控的數據量之大可想而知。寶信軟件需要匯總這些海量交通信息,對卡口情況進行自動監控與管理,包括出入卡口車輛信息查詢,套牌識別等等,以便于交警以及相關人員做出正確的判斷,從而實現對交通違法車輛、肇事車輛、逃逸車輛等進行處罰,實現全天候監控。
在以上的兩個場景中,數據不僅體量極大,且分布非常廣泛,更重要的一點是,這些數據中大多是讓傳統數據庫無能為力的非結構化數據。因此,在經過縝密思考和測試后,寶信軟件選擇了IBM的NoSQL數據庫Cloudant,與IBM一同應對這些城市交通發展難題。
IBM Cloudant優化寶信軟件車聯網方案
Cloudant是IBM在去年2月收購的初創公司,Cloudant軟件基于開源數據庫軟件CouchDB,用于處理JSON格式的信息,其搜索用的是Apache Lucene,提供跨區域復制,有強大的數據持久性,并且支持單租戶和多租戶集群。董文生表示:“IBM Cloudant可以實時分析多類型復雜數據,通過它可以實現諸如套牌車輛識別等艱巨的任務。”
董文生介紹了三個Cloudant吸引寶信的功能:
寶信對Cloudant進行了測試,將一臺120核、128G內存的服務器虛擬出6臺機器,測試內容包括數據插入性能、二級索引、復制、Rest API、MapReduce及查詢性能。
測試結果如下:
董文生稱,性能測試基于四種模式進行,性能表現完全符合寶信的要求。
董文生強調,Cloudant的地理位置信息特別優化,在搜尋一個空間,比如查套牌車時,表現非常友好。還有一點,Cloudant支持各種部署模式,不管是公有云、私有云還是本地部署都可以,這也是寶信在很多項目中都在考慮部署Cloudant的重要原因。
在會后采訪中,記者采訪到了IBM中國開發中心信息管理總經理朱輝,這位CDL高管再次強調了IBM開放的技術合作形態。朱輝表示,“通過大數據的創新型思維來改變傳統企業、傳統行業進行新的轉型,是IBM在跟市場結合的方式上的戰略性轉變。未來在中國市場,IBM會將自身的技術沉淀,跟像寶信這樣的企業一同合作,通過兩家公司的合力共同創新,推動像寶信這樣的中國企業創造出新的價值,走上一條真正由大數據驅動企業決策、企業轉型的新模式上來。”