精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

P2P行業大數據征信前瞻

責任編輯:editor004

2014-09-29 10:56:47

摘自:搜狐證券

9月23日,由上海市經信委、上海市金融辦指導,上海市信息服務行業協會牽頭編纂的《2014上海網絡信貸服務業白皮書》發布。從目前阿里巴巴和百度擁有的數據資源判斷,筆者認為未來P2P大數據征信的數據框架大概如下

9月23日,由上海市經信委、上海市金融辦指導,上海市信息服務行業協會牽頭編纂的《2014上海網絡信貸服務業白皮書》發布。白皮書顯示,目前央行征信中心針對擁有信用記錄公民收集的信息共包含兩類。一類是個人基本信息,另一類是信用卡消費及還款記錄。但P2P網貸行業判斷借款人信用評價的數據包含手機清單、個人收入證明、社保信息、家屬身份信息、駕照信息等多達34個信息類別。這一現象充分顯示了央行征信系統的局限性,因此,一直備受關注的P2P行業大數據征信再次引發關注。借這個機會,陽光寶利市場研究部希望對P2P行業大數據征信進行一次前瞻分析,簡單解讀這一趨勢的特點與動態。

在討論大數據征信問題之前,首先要明確所謂大數據的概念。很多人以為,數據規模大就是大數據,這種觀點是錯誤的。所謂大數據,不但數據規模大,而且最重要的是要數據結構復雜。正如前文提到的央行征信系統,其中包含了8億居民的信用卡信息,規模巨大,然而由于只包含這一類信息,數據結構極其簡單,因此并不能稱之為大數據,充其量只能稱其大型數據庫。數據結構復雜要求針對數據庫中每一個實體都有非常多屬性的數據,以個人來說,不但要有各種社會學背景、財務數據等等,還應包括上網習慣、操作行為、移動路徑等等一系列的數據,達到這種復雜程度的數據結構才能被稱為大數據,才是P2P征信需要的大數據。

目前,有這種復雜數據積累并且已經具備大數據分析基礎的公司只有兩家——百度和阿里巴巴。幾乎所有中國網民都會使用百度或阿里巴巴的產品,因此這兩家公司有足夠的數據儲備。同時,這兩家公司都在至少五年以前就開始投入大量資源探索大數據業務。百度公司已經有一系列探索性質的大數據分析結果公布出來,根據這些分析結果判斷,百度在大數據分析技術上已經趨于成熟。其研究成果最具代表性的就是百度經濟指數預測。百度通過大數據對未來三個月進行經濟指數預測,其預測結果與三個月后國家統計局公布的統計結果重合度極高:

阿里雖然始終沒有公布其大數據的研究成果,但是阿里巴巴已經開放大數據平臺,同時保持每年暑假都舉辦大數據競賽,吸引了大量優秀人才參與大數據分析工作中,又將這些人才的個人電腦納入了大數據云端處理系統,增強了數據處理能力。在阿里巴巴成功IPO后,更是將大數據列為其募集資金的三大投資領域之一,因此即便其還沒有成型的大數據研究成果出爐,但是可以預見阿里巴巴在這一領域應該很快就會有所建樹。

從目前阿里巴巴和百度擁有的數據資源判斷,筆者認為未來P2P大數據征信的數據框架大概如下:

社會學背景:最基礎的分析維度,通過用戶注冊信息獲得;

現金流:判斷經濟狀況的基礎維度,通過寶寶類產品、第三方支付等數據獲得;

操作習慣:不同職業的用戶操作習慣有非常顯著的差異,可以用來佐證用戶職業類型,通過用戶操作習慣記錄系統獲得;

信息偏好:不同階層用戶信息偏好同樣有顯著差異,通過用戶搜索習慣獲得;

消費習慣:消費習慣代表消費能力,通過用戶消費記錄獲得;

人際網:根據社會分層理論,社會人總是在和自己同一層次的人互動,通過APP讀取聯系人信息獲得;

遷徙特征:可判斷是否為本地人、旅游目的地偏好等,通過APP發送定位信息獲得;

消費場所信息:消費場所檔次特征可以代表消費能力,通過APP發送定位信息獲得。

可見,大數據征信可以極大的豐富目前P2P行業的征信系統,雖然無法起到替代作用,但是可以從更多維度進行判斷。但是排除政策等系統性障礙,大數據征信目前還面臨著幾個嚴峻的問題,導致不能完全發揮效用。

第一,非結構化數據處理。在年初的百度大數據論壇上,百度公司的數據科學家就曾提到,目前百度大數據面臨的最大問題就是無法從海量非結構化數據中篩選出有價值的數據,百度公司每天凈增數據量大約為1PB,其中至少99%是無效數據,如何從中篩選出有效數據目前還是一個無法攻克的難關。

第二,自然語義分析。大數據征信中有大量需要應用到自然語義分析的工作,如信息偏好等,都需要將文字轉化為可以量化的數據,然而由于漢語不是進制語言,計算機無法直接識別,所以只能依靠自然語義分析,但漢語詞語組合極其復雜,自然語義分析最基礎的工作分詞依然無法通過計算機完成,目前所有自然語義分析都是基于詞庫分詞,效率極其低下,完全無法適應用戶互聯網使用習慣的快速變化。

第三,大數據分析與市場研究的鴻溝。這一點是目前大數據征信面臨最大但也最容易被人忽略的問題。當大數據還只停留在數據層面上時,對于P2P征信是沒有意義的,必須有人將數據轉化為結論,有何種上網行為的人按時還款的可能性更高,有哪些信息偏好的人更容易違約等等,這些問題無法直接反映在大數據的分析結果上,此時就需要有善于解讀和分析客戶行為的市場研究方通過市場研究手段進行數據解讀與建模,然后才能被P2P公司應用。因此,大數據能夠完全應用到P2P征信領域的前提是大數據部門與市場研究部門的對接融合,將數據轉化為結論。但目前這兩個部門之間存在非常嚴重的鴻溝,試想,一群連馬斯洛都沒聽說的數據分析工程師與一群連oracle都不會讀的市場研究人員之間在溝通時如何相互理解?因此目前中國整體大數據領域面臨的最大問題就是數據分析工程師已經寫出了大量的算法代碼,但不知應該怎么用,而市場研究人員也做了大量假設和建模,但不知道怎么實現,雙方在溝通的時候都在自說自話,溝通之后都發現自己什么都沒聽懂。這也就導致了大數據還只停留在一些有成型模型的宏觀層面應用,無法深入到像P2P征信這種細化到個人行為判斷的深度。

因此,陽光寶利市場研究部認為,可以預期,在將來個人征信牌照發放之后,P2P大數據征信應該首先通過社會學背景和現金流這兩個簡單維度進行探索,同時等待自然語義研究的發展以及數據分析與市場研究單位打破雙方之間的技術壁壘順利對接,才能開始真正意義上的大數據征信時代。

鏈接已復制,快去分享吧

企業網版權所有?2010-2024 京ICP備09108050號-6京公網安備 11010502049343號

  • <menuitem id="jw4sk"></menuitem>

    1. <form id="jw4sk"><tbody id="jw4sk"><dfn id="jw4sk"></dfn></tbody></form>
      主站蜘蛛池模板: 马龙县| 英德市| 竹山县| 大连市| 综艺| 法库县| 涿州市| 凉城县| 开化县| 衡阳市| 东安县| 岳西县| 松原市| 临夏县| 江门市| 津南区| 湖州市| 永寿县| 巴林左旗| 安国市| 铜陵市| 东乡县| 灵山县| 广水市| 息烽县| 和静县| 高邑县| 武川县| 镶黄旗| 河津市| 吉林市| 镇雄县| 偃师市| 长春市| 六枝特区| 谷城县| 文昌市| 镇安县| 海城市| 鸡东县| 浙江省|