大數據是近年來非常熱門的一個概念。因其熱門,所以吸引了很多保險業人士的關注,普遍認為大數據將給保險業帶來新的技術手段,有利于更精準地挖掘客戶需求、產品定價和營銷、風險防范以及業務決策。但筆者認為,大數據很有可能給保險業在風險管理領域帶來前所未有的挑戰,保險業一定要預作準備。
大數據分析的是數據,但數據不等于事實。
大數據分析數據間的相關關系重于因果關系,而對事實的分析研究必須建立在因果關系基礎上。
大數據應用的一個典型例子就是谷歌利用人們在網上的搜索記錄來預測流感爆發的趨勢。根據維克托·邁爾-舍恩伯格在《大數據時代》這本書中所寫,谷歌在2008年統計人們搜索流感關鍵字的頻率,將其與2003年以來的搜索結果均值做對比,準確預測了2009年流感的爆發,準確率高達97%。但這本書沒有講2010年和2011年的預測準確率。實際上,這兩年的準確率都大幅走低,其中2010年的預測結果顯著低于實際結果,2011年的則顯著高于實際結果。
根據2014年3月美國《科學》雜志一篇文章的研究結論,谷歌預測失靈的原因就在于只注重研究數據間的相關性,而忽視了數據間的因果關系。流感關鍵字的搜索頻率同流感爆發之間可能有相關關系,但未必是因果關系。比如某部同流感有關的電影正在熱映,某個已故名人是因流感去世的,恰逢他的忌年或生年,這些都可能增加對流感關鍵字的搜索,但同流感爆發沒有因果關系。此外,“預期的自我實現”也是一個原因。“預期的自我實現”在股票市場上體現得最典型。人們預期某支股票股價會上漲,于是紛紛買入,股價隨之上漲,人們發現股價真的上漲了,更加堅定信心,大量買入,股價上漲得更為猛烈,預期就這樣自我實現了,而股價上漲的信息源頭可能只是一則小道消息,與價值重估或業績好轉根本無關。在流感預測上也類似,開始時預測流感有爆發跡象,各種媒體大量轉載,人們也紛紛轉發各種預防常識,結果流感關鍵字搜索頻率大幅上升,于是預測值也大幅上升,意味著流感可能即將大爆發,最后才發現不過是一場小型流感;如果開始時預測流感不太可能爆發,各方面放松了對流感的警惕,疫苗準備不足,人們也疏于防范,結果一場小型流感反倒大流行起來,因為臨時生產疫苗已經來不及了。
實際上,只關注數據間的相關關系,而忽視因果關系,在統計學上被稱為“數據挖掘誤區”,是早已被批駁過的錯誤做法。
大數據可能在人們無意識時有效,當人們有意識地使用大數據時,大數據的預測就不準了,這可稱為大數據的“測不準原理”。
“測不準原理”是物理學中的一個概念,指測量粒子位置,必然會影響粒子的速度;而測量粒子速度,又必然影響粒子的位置。
這個道理同樣適用于大數據結果的運用。比如根據交通流量預測,某條高速公路可能即將發生擁堵,司機知道這個情況后,選擇走另外一條路,但當很多司機做出這一選擇時,堵車的道路可能恰恰是原本預測不堵車的路,原本預測發生擁堵的高速路反倒沒有擁堵。這一問題固然可以通過提高交通流量預測頻率的辦法解決,但對于那些被堵在路上的司機而言,已經是于事無補了。
再舉個例子。根據健康大數據預測某人患某病的概率很高時,可能會對該人收取很高的保險費乃至拒保,但該人知道這一情況后,加強運動、注意飲食、愉悅心情,結果在很大程度上延緩了病癥發作,大數據的預測失真了。
當大數據分析成為一門技術時,人們可以很容易地算出風險發生概率,那時只有高風險的人才會買保險。
隨著健康管理技術的不斷進步,未來人們可以很容易地利用隨身設備監測各項身體數據,并整理成可分析的大數據。利用這些數據可以算出自身患病的概率,將患病概率同對應的純風險損失率作對比,如果低于純風險損失率,就選擇風險自留,不投保;如果高于,就選擇投保,把風險轉移給保險公司。但當大部分投保人的出險概率都超過計算保費時的純風險損失率時,保險公司必然是虧損的。
上面講的不是天方夜譚。目前健康監測技術已經發展到可嵌入人體牙床、血管、內臟的可嵌入設備,乃至根本不用嵌入任何設備的超聲波診斷技術。至于如何計算患病概率,不排除以后出現分病種的患病概率計算器,就像現在網上的等額本息還款計算器、提前還款計算器一樣,客戶只需按要求輸入數據,概率自動求出。甚至健康管理設備可以直接算出患病概率,顯示給客戶。
20年前,膠片相機流行的年代,修理照片還是一門技術活,要由專業人員操作才行。而現在呢,手機拍照,美圖秀秀、魔漫相機等各種修圖軟件爭先恐后降低技術門檻,力爭讓人上手就會。修飾照片已經成為一項普遍技能。20年后,人人都可能成為自身健康的精算師,小病走社保,常見大病先自測,高風險的投保,低風險的自留,殘留風險走大病補充,特殊疾病以社交關系為紐帶走互助,而保險公司承保的大部分是高風險業務,虧損將成為必然。這一場景不是沒有可能。
在其他風險管理領域也可能出現類似情況。2012年8月30日的《紐約時報》報道了一家創新公司,叫氣候公司。據當時報道,這家公司計劃購買亞馬遜提供的氣象云服務,在美國全境采集100萬個地點的實時氣象數據,為客戶提供臨時、短期和中期的氣象預報服務,并可結合客戶所在地的土壤、水質等情況,為客戶提供氣候風險報告。客戶根據報告,可以選擇是否在保險公司投保農業氣候保險。可以想見,只有當客戶的氣候風險大于計算保費時的純風險損失率時,客戶才會購買氣候保險。這一模式如果推廣開,美國的農業保險公司恐怕只能承保病蟲害和龍卷風、雹災等突發性氣象災害保險了,洪澇、旱災等常規性農險責任,要么客戶不投保,要么投保的就都是高風險業務。
無獨有偶,2014年5月27日,中國氣象局公共氣象服務中心與阿里云達成合作,海量氣象數據將通過阿里云計算平臺,變成可實時分析應用的“活數據”。計劃深度挖掘利用的數據包括:建國以來的歷史氣象數據;全國2萬多個觀測站、衛星、雷達監測的氣象觀測數據,包括降水、溫度、風力風向、地面結冰、太陽輻射、酸雨、空氣能見度等30余項;短期、中期、長期的氣象預報數據;通過國際交換獲取的全球氣象觀測、預報數據。阿里云計劃將氣象數據嵌入阿里來往、支付寶、高德地圖等產品,多渠道傳播氣象等災害預警信息,同時為服裝、飲料、空調、旅游等領域客戶提供季節性生產、經營建議等,計劃涵蓋飲料銷量、羽絨服銷量、空氣凈化器銷量、洗車、太陽能發電、居民用電量、農產品生產、災害、航班延誤、工程工期預測等。
大數據只關注數據,忽略了人性。
具體到保險業,最大的人性就是逆選擇的道德風險。目前熱門的大數據加可穿戴設備的技術路線恰恰蘊藏了很大的道德風險。
大數據應用有一個典型例子,就是百度、阿里巴巴等平臺根據客戶的搜索記錄,主動向客戶推薦相關產品,促進客戶購買。這一推薦服務有利于滿足客戶需求,因此是客戶需要的,客戶愿意真實地向平臺暴露自身的搜索情況,為的是換取更精準的商品推薦。另一個典型例子是以阿里小貸、京東金融為代表的基于網絡交易數據發放的網商信用貸款。阿里小貸中,阿里巴巴是根據商戶最近6個月的實際成交額并結合物流數據進行審核確定的,涉及出口時,還要關聯海關數據,同時商戶在阿里平臺交易,還需要交納一定數額的保證金或購買履約保險。總之,無論哪種情況,第一客戶有主動的需求,從而在主觀上避免了提供虛假數據的情況,第二平臺有較為完善的風險控制手段,在客觀上能夠防范信用風險。
但大數據在保險業的應用是相反的。高風險客戶很清楚保險公司對自己了解得越準確,對自己收取的保費就會越高,因此他有足夠的動力不向保險公司展示真實情況,而可穿戴設備正好提供了這樣一個工具。保險公司無法掌握到底誰在佩戴設備,采集的數據到底是不是被保險人的,即使指紋開啟也無法確保開啟后是被保險人在佩戴。如果要求被保險人每隔一段時間就用指紋再確認一次的話,客戶體驗又不好,特別是監測睡眠時怎么辦?
解決問題的一個思路是使用可嵌入設備,在投保時把設備直接嵌入被保險人體內。但在保險業競爭激烈的情況下,客戶會同意嵌入設備嗎?又有哪家公司敢于冒著丟失客戶的風險這樣嘗試呢?因此,大多數公司必然還是會選擇更易為客戶接受的可穿戴設備。
另一個思路就是保險公司不提供設備,而是從第三方健康管理公司購買客戶的健康數據,以減少客戶的逆選擇風險。但是中立的第三方健康管理平臺的數據就一定真實嗎?我在朋友圈里曬我每天堅持走路10公里,就真的能夠證明我走了嗎?有無可能是我的虛榮心在作怪呢?此外,第三方健康管理平臺有權向保險公司出售或提供客戶私人的健康數據嗎?如果經過客戶授權,那么客戶就知道數據會被用于保費厘定,則依然存在逆選擇風險;如果沒有經過客戶授權,就可能涉嫌泄露客戶隱私。即使這些問題都能夠得到解決,也就是第三方健康管理平臺可以合法合規地提供高質量的客戶健康數據,可以斷言,此時該平臺必然會要求保險公司付費取得客戶數據,對該平臺數據的爭奪又會淪為一場比拼費用的競賽,就如同現在各家保險公司對淘寶入口和銀行渠道的爭奪一樣,保險公司還是翻不了身,永遠在給別人打工。
第三個思路是保險公司搭建移動健康管理平臺,邀請健康程序開發商接入平臺為客戶提供服務,使用程序的客戶經某種方式轉化為保險公司的客戶,保險公司則在承保時參考客戶在平臺留下的數據。此思路在美國已經落地,但效果并不好。美國壽險公司安泰在2012年上線了兩個移動健康管理平臺——健康參與者和健康通行證,但在今年宣布將陸續關閉這兩個平臺。原因在于,平臺雖已吸引20余家健康程序開發商接入,但始終無法導入足夠的終端用戶。沒有終端用戶,后續承保工作就無法開展,保留平臺就只能是在燒錢。
保險業該如何應對
一切從實際出發,堅持獨立思考,避免人云亦云。
現在新技術、新概念層出不窮、日新月異。保險業一定要穩住心神,千萬不要盲目跟風。既要解放思想,對新事物持歡迎態度、積極研究,更要實事求是,始終記住保險業的實力弱、底子薄,一步也失誤不得;始終記住保險經營的是風險,面對的是人性,人性中也有丑惡的一面;始終記住商業保險不是慈善事業,盈利是可持續經營的前提,對那些“羊毛出在豬身上”的互聯網免費模式,一定要想清楚了再干。
積極研究大數據,建立自己的標準和技術門檻。
移動互聯網和云服務時代的大數據應用已經成為必然趨勢。面對這一形勢,保險業無視、躲避甚至畏懼大數據都是不可能的。保險業應當主動作為,利用自己的資金優勢和數據積累,在大數據領域提前布局、占位,建立自己的標準和技術門檻,有意識地引導大數據應用朝著有利于自己的方向發展。
目前,大數據應用還處于摸索試驗階段,主流應用不過集中在精準廣告推送、客戶需求分析上,還沒有深入到風險識別、健康管理等領域。保險業一定要有危機意識,盡快確立在大數據應用上的技術壁壘(如專利),盡快成為游戲規則的制定者,甚至還可以考慮直接并購相關的大數據應用研發公司。唯有如此,挑戰才不會演化成危險。
筆者在這里想引用阿里巴巴創始人馬云的一句話。馬云講,“阿里不是一家拓展技術邊界的高科技公司,而是一個利用技術進步拓展商業邊界的公司。阿里的商業模式不是商業帝國,而是商業生態圈”。阿里尚有此雄心,坐擁9萬億資產、號稱從業人員近400萬的保險業難道沒有嗎?難道一定要坐等被別人顛覆嗎?
保險公司由被動的風險接受方向主動的風險管理方轉型。
美國波士頓大學通過對美國產業革命的歷史數據分析發現,產業變革通常發生在兩個領域:一是舊產業的核心業務;二是舊產業的核心資產,主要指知識、品牌、專利等無形資產。產業變革的路徑又可分為四種:一是核心業務和核心資產都因變革而被淘汰,比如數碼相機取代膠片相機,不但膠片相機本身消失了,而且柯達、富士等膠片生產巨頭也消失匿跡了;二是核心業務和核心資產隨著技術進步也在漸進式變革,同新技術融為一體或各有側重地發展,比如拍賣行既有傳統的線下拍賣,側重高價值、非標準化的拍品,也有線上拍賣,側重價值不高、標準化的拍品;三是核心資產受到沖擊,但核心業務仍然保留,比如激光打印機雖已得到大規模應用,但傳統的針式打印機仍然在海關、稅務等領域的多聯打印場景下廣泛使用,只是不再有知名品牌存在了;四是核心業務受到沖擊,但核心品牌仍然保留,比如面對京東等線上平臺電商的沖擊,蘇寧、國美等傳統線下家電大賣場的銷量明顯下滑,但品牌仍是耳熟能詳,具有很高的價值。
基于上述理論,保險業面對大數據挑戰的最優應對路徑自然是核心業務和核心資產都得以保留,并漸進式變革,同新技術融為一體。由此,保險業一個可能的轉型路徑就是由被動的風險接受方向主動的風險管理方轉型,保費則轉變為風險管理費。
以健康險為例,一個可能的辦法是由賣健康保險產品向提供健康管理服務轉型。未來,客戶每年向健康管理公司(保險公司)繳納一筆年費,享受一年的健康管理服務(具體內容還需要在實踐中摸索),如果在一年中出現健康問題,由公司負責安排治療并承擔費用,如果全年健康,則公司賺取利潤。
氣候保險領域也是如此。農場主向氣象風險管理公司繳納一筆年費,享受一年的氣象預警服務,如果一年中出現預警以外的突發性氣象災害或超過預警值的氣象災害時,風險管理公司因為履約失誤,向農場主賠償損失,如果一年中出現的氣象災害都在規定時間內被公司進行了預警,則公司充分履約,無須向農場主賠償。
實際上,上述轉型思路在國際保險界已經開始顯露苗頭。澳大利亞人傷理賠管理界已經提出,應把人傷理賠管理視為健康和生產力的推動者,而不是傳統的履行賠付義務、降低賠付成本的部門。他們認為,理賠管理的目的是確保受傷個體及其生產力得到最大程度的恢復,而保險公司則應為實現上述目的提供合理、充足和必要的服務。
在新技術條件下,要繼承和發揚傳統的風險防范手段。
大數據的優勢和固有的缺陷,決定了保險業既要善于使用大數據,但又不能迷信大數據。如何協調兩者?一個可能的辦法就是繼承和發揚保險業幾百年積累下來的風險防范的經驗做法,比如核保體檢、免賠額、無法找到第三方時強制免賠等。正如電腦可以替代筆和紙,但永遠無法取代筆和紙,因為電力供應可能中斷、電腦硬盤可能壞掉、電子信息可能泄露,有時筆和紙可能是最保險的。用戶至上、體驗為王這些互聯網時代的口號,固然有道理,但保險業仍需對其保有一分警惕,千萬不能脫離行業實際。