中國大數據第一人涂子沛說:2010年代的中國,農業文明、工業文明和信息文明“三元并存”。棲身于城市立交橋底的農民工拿著智能手機、賣包子的小攤主也有二維碼支付、農業大省也必須上馬云平臺,這種交錯、混搭,是一種獨特的視覺沖擊。
面對大數據,相較于各種制度較為健全的美國,其利用大數據更多著眼于優化,而我國的現狀,更多是變革或者說顛覆性質。面對經濟艱難的2016年,各行業的逐步蕭條似乎更加容易暴露由于原來經濟高速發展掩蓋的各類社會問題,類似和頤酒店這類安全問題似乎并非孤例。
社會問題考驗政府治理能力,在信息化時代,預防、追蹤、解決社會問題成為政府利用大數據最好的武器。作為數據銀行理念的倡導者和踐行者——數據堂,一直關注和思考聯合其他數據服務于政府治理。不得不說,政府治理涉及的數據種類眾多,數據維度豐富,數據更新速度快,價值高等特性,是當下考驗一家大數據企業和政府數據共享的絕佳試驗項目。
維穩事件日益凸顯
利率市場化引發的低利率時代使得民間資本涌出,這些資本原是有利于社會經濟結構協調發展的,也受到國家支持。但這一機會被別有用心之人趁火打劫。所以我們看到很多P2P跑路、倒閉現象,于是出現民眾維權、政府維穩的事件日益增多。怎樣識別老賴,不僅是投資者教育的問題,更是政府當前面臨的棘手問題。
偷稅漏稅屢禁不絕
在我國,偷稅漏稅屢禁不止,指望人人承擔企業家責任似乎不切實際,但作為政府應該手握一把“照妖鏡”。稅務是財政收入主體,是政府運作的基礎,茲事體大,對偷稅漏稅的企業及個人能夠及時發現,預警,采取措施,是新時期考驗政府執政能力的重要指標。
家庭信用亟待解決
在一個有著數千年“仁義禮智信”道德根基的國家,卻時刻上演著違反道德標尺的戲碼,老人假摔、碰瓷時刻挑戰人性底線。幾個老人訛詐的事例壞了一鍋湯,剩下九十幾個老人摔倒無人扶,沒人扶主要原因是怕連累自己,暫不說扶起之后會不會被訛,就說送到醫院怎么辦,誰出錢?治不治?面對這類社會問題,有沒有兩全其美之策?
恐怖事件日益猖獗
反恐已經越來越不是話題,而是隨時可能在你我身邊上演的真實血案。作為公民,有義務舉報任何與恐怖有關的蛛絲馬跡,但公民畢竟沒有武裝力量,真正還需依靠政府力量,政府面對恐怖活動,究竟如何及早發現并有效制止?
政府大數據能做什么
既然提出上述社會問題,就要尋找解決途徑。鑰匙就埋在政府大數據這個金礦里。這里談的政府大數據是廣義上的,包含國企大數據,比如銀行、民航、電力、電信、自來水等企業數據;此外,還有交通、醫療、教育、工商、公安、法院、稅務、社保、住建等政府行政部門數據。這些數據匯集到數據銀行,通過數據銀行管理運營,可針對不同的應用場景提供不同的解決方案。
大數據維穩
比如在大數據維穩案例中,針對某金融公司日常經營活動,可以實時調用該企業銀行、通信、電力、自來水等相關數據進行企業經營狀況評估,一旦發現數據急遽變化,便可發出預警,從而提前作出判斷,進而采取相關措施。
大數據防偷稅漏稅
比如大數據反偷稅漏稅案例,同樣針對企業經營進行大數據匯集,綜合工商、稅務、社保、電力、互聯網等數據進行分析,從企業支出、營收與社保、耗能等數據對比上進行量化,從而排查出企業偷稅漏稅等非法行為。
大數據建立家庭信用卡
對于獨居老人的案例,可以利用戶籍、銀行、社保、住建、消費等數據構建公民家庭信用保障體系,制作出家庭信用卡或者市民卡,卡上有老人家庭各方面數據,有助于幫扶人群和醫療機構采取有效核查并提供及時救助。
大數據反恐
針對大數據反恐,政府大數據平臺通過整合分析交通、賓館、通信、戶籍、危險品銷售等數據排查出一個地區某些人群的相關危險信息,這些信息及時輸送到相關部門及早采取針對性措施。美國大數據公司Palantir以此查出本拉登信息就是大數據反恐的鼻祖案例。
政府大數據價值空間
政府掌控的數據涉及國計民生方方面面,這些數據除了政府治理改善民生服務外,還可以創造難以預估的商業價值。當前金融征信、人工智能、醫療健康、智慧交通等等領域都需要接入政府數據以滿足其商業應用需求。
據麥肯錫統計,交通、教育、醫療健康等行業的全球數據開放可創造3.2萬億到5.4萬億美元的經濟價值。據IDC預測,全球大數據市場年增長率高達40%,在2017年將達到530億美元。易觀國際預測,中國政府大數據應用市場規模將在2020年達574億元。
政府大數據運營解決方案
《大數據發展綱要》標志大數據國家戰略形成,其中,數據開放、共享與安全是三大重點工程。目前政府數據公開實施困難,進展緩慢,究其主因,主要是沒有成功機制借鑒,缺乏動力,深層原因是缺乏大數據系統規劃和深入挖掘數據價值的能力。
數據堂在大數據領域擁有五年數據采集、處理、交易和API服務方面技術和經驗,以數據眾包采集平臺和數據處理技術實力獲取中關村國家自主創新榮譽資質。數據堂政府大數據運營解決方案總體分四步走戰略,第一步搭建政府大數據運營平臺,第二步收集匯總數據,第三步引入數據價值評估機制制定數據價格,第四步挖掘對接商業應用價值。這四步走構成數據銀行的運營軌跡。
在搭建平臺方面,需要考慮的是,對是否建立智慧城市的地方政府又分兩種模式,沒有建立智慧城市的可以直接搭建大數據平臺,避免基礎設施重復建設;已建立智慧城市也存在智慧城市平臺有數據的和沒有數據兩種情況,有數據的可以通過智慧城市平臺直接對接大數據平臺,沒有數據由大數據平臺對接相應城市委辦局解決數據收集問題。
收集過來的數據,需要進行數據處理、清洗、結構化和關聯。通過這道程序,解決數據隱私問題,去除敏感信息。進而得到數據評估部門的數據價格制定,通過數據定價,數據成品即可服務于商業化應用。
以金融征信大數據為例
從政府反饋的信息看,金融征信成為政府大數據商業開發與應用最緊迫需求。由于近年金融業大發展,具有較強的經濟實力及內需動力;另外,金融業同樣遇到瓶頸,征信體系作為金融業基礎,其建立迫在眉睫。所以政府大數據運營可以以金融征信大數據作為試點工程切入。
由于我國征信體系建立不完善,留給大數據的空間異常大。大數據征信核心是從數據廣度上將權重加在借款人日常生活的交易數據及社交數據上,比如借款人一般都在哪里消費,月均消費金額是多少,消費支出中的分布情況如何,社交圈活躍度如何等諸如此類的問題。這類數據具有很好的連貫性,可以從中分析很多的用戶特性,習慣并反向推斷借款人的實際財務狀況,進行風險篩選;也能大幅增加借款人的違約成本從而警示借款人遵守規則、按期還款。最重要的是,這些數據造假可能性非常低,因為都是大數據環境下的各類碎片信息收集和分析,真實性甚至可以做到百分之百。
經過4年積累,數據堂聚集了大量征信數據集,建立了大數據征信查詢平臺,針對個人信用和企業信用客戶,金融機構可以借此平臺快速查詢借款人或企業信用評估信息,提高審核效率,降低人工核查成本。