引言:不同于傳統的數量統計類的分析,大數據分析具有更新頻率快、真實性強、精準度高、衡量范圍全等特質。
近年來,股市黑天鵝事件頻發,所及之處無不掀起一片血雨腥風。一場塑化劑風波,令白酒股4天內蒸發447億市值;重慶啤酒“疫苗血案”吞噬市值289億;瘦肉精事件卷走170億財富;2015年11月初私募大佬徐翔涉嫌違法犯罪,被公安機關依法采取刑事強制措施后,其關聯的數十只概念股集體連續跌停,香港上市公司七星控股復牌后更是一度暴跌超過40%……一連串觸目驚心數字帶來的直接后果,就是基金管理人業績急劇跳水,管理的財富瞬間旋入黑洞,毀滅于無形。
黑天鵝事件(英文:Black swan event)是指非常難以預測且不尋常的事件,當其發生時通常會引起市場連鎖負面反應甚至顛覆。納西姆·尼古拉斯·塔勒布在《黑天鵝》一書中提出了黑天鵝事件的定義,簡而言之就是:稀有性、沖擊性和難以預測性。塔勒布認為,生活只是少數重大事件的累積結果,極少數根本無法預料卻影響巨大的黑天鵝事件,決定了我們一生的命運,甚至決定一個國家的命運。黑天鵝事件雖然難以預測,但隨著社會進步和文明發展,尤其當人類社會進入大數據金融時代,股市黑洞不再密不可測。黑天鵝事件是否會降臨在某一類投資經理身上,投資經理踩“雷”所產生震幅和影響有多深遠,我們借助大數據,一定程度上可實現提前預判。
正如十八世紀富蘭克林用風箏實驗捕捉雷電,顛覆了人類對雷電的認識.二十一世紀的大數據金融專家,也希望用大數據的方式捕捉資本市場的雷電,揭示雷電的真正面目。本文以基金管理人為研究對象,試圖揭示管理人踩雷背后的原因,并計量當黑天鵝真正來臨時,會造成怎么樣的連鎖踩踏反應。
事實上,基金管理人踩雷的原因有很多。因為單就黑天鵝發生的原因來分類,有諸如公司治理不當、財物造假、信披不實、業績變臉等內部原因,有諸如外部輿論傳播、政策原因等外部原因。作為基金管理人,“常在河邊走,哪有不濕鞋”,但為什么有些群體踩雷概率特別大,踩雷后受損特別嚴重?這就需要用我們的大數據來全面分析得到答案。
不同于傳統的數量統計類的分析,大數據分析具有更新頻率快、真實性強、精準度高、衡量范圍全等特質。通過建立知識圖譜的方式使機器能夠自己生產出邏輯,對數據進行分類和判斷,從而機器就能擁有部分研究員的視角,可以對目前發生的黑天鵝事件進行綜合全面的分析,甚至可以達到預測黑天鵝的效果。
利用大數據達成機器學習的過程是漫長而充滿挑戰的,要建立有效的大數據分析體系,需要有強大的硬件和軟件支持:包括搭建cloud平臺,建立網絡爬蟲系統,構建中文知識圖譜,在云端建立開源分布式計算的數據庫等等一系列的程序支持,還需要配合svm算法進行文本聚類分析。更重要的是,除了算法、IT、數據的支持除外,需要有一批對金融本質有深刻洞察能力的專家團隊負責整理相關的材料以及分析邏輯,作為機器學習的訓練素材。要達成此事件,既需要公司具備完善的大數據生產土壤,還需要有先天的金融基因和金融生態環境,才能確保利用大數據揭秘股市黑洞成為一種切實落地的方案。
大數據分析將投資經理的個人屬性和社會屬性加入其中,個人屬性包括如性格、教育工作背景、勤奮度等維度,社會屬性涵蓋了如父母、同學、職場引路人等維度,這些維度就像冰山潛伏在海平面以下的那部分,雖然隱蔽,卻是反映人性的基石。個人屬性和社會屬性的標簽大多來源于網上公開的新聞、微博、股吧、以及通過自媒體發布的相關言論等,這種信息大多以文本的形式呈現。在傳統的方式下,這些海量信息沒有被直接量化,但在大數據的背景下,這些文本經過解析和拆分,可轉化為結構化的數據,再配合機器學習和人工校驗,就產生了刻畫管理人投資能力的相關因子,之后進行滾動迭代,不斷地重復累積,讓因子精度越來越高,最后讓機器具有了實時判斷黑天鵝的邏輯和能力。
通過對比近十年的數據發現,專業基金管理人布局的個股往往與他們過往經歷與成長環境存在高度相關性。比如今年奔私的前公募一姐王茹遠,曾經耗時一年零一個月的時間,將寶盈核心優勢基金從一只單位凈值不到7毛錢、規模不足1億元的“小危”基金,迅速做到凈值增長超過50%、業績稱冠混合型產品、規模突破十億元的“明星”基金。數據顯示,王茹遠在2007年12月至2011年7月就職于海通證券股份有限公司,擔任TMT行業首席分析師。2011年7月加入寶盈基金管理有限公司,擔任核心研究員直至基金經理。事實上早在2001年王茹遠在國外讀書的時候,她便非常關注網易、新浪這些在海外上市的互聯網企業。畢業后王茹遠進入了知名IT公司工作,對互聯網行業的發展有了更為深刻的認識。有趣的是,王茹遠之所以后來進入證券行業,是因為她當時從事的服務提供商行業由于運營商政策整頓,導致行業發展遭遇重創,事業前景黯淡而被迫選擇轉行。這些工作經驗也讓王茹遠對那些過度依賴上游、純粹靠關系拿單的公司敬而遠之,形成了立足行業發展選股的“審美觀”。即便奔“私”以后,“一姐”依然堅持其一貫的投資風格和行業偏好,重倉景氣度持續向上、能把握住行業拐點的優質成長股(大部分集中在TMT行業)。筆者不去評論其投資能力如何,只是料想,如果未來市場遭遇黑洞,經歷類似2000年時科技股泡沫的洗禮,形成戴維斯雙殺,又或整個行業遭遇黑天鵝事件,那么以王茹遠為代表的這類私募基金管理人將折戟沉沙,觸雷對其整體投資業績影響巨大。這點從其今年股災以來,旗下天堂硅谷大浪潮母基金8月底逼近清盤線而被迫采取平倉行為已經得到證實。
將私募基金管理人作為研究對象,我們還能發現類似徐翔事件的引爆,對資本市場產生巨大的破壞力,造成嚴重的輪番踩踏事件。以概念股康強電子(002119)為例,公司半年報顯示,澤熙6期單一資金信托計劃位列公司前10大股東。自2015年11月1日起公司連續兩日跌停,前十大股東中“新華鑫利靈活配置混合型證券投資基金”與“南方策略優化混合型證券投資基金”同時踩雷。進一步挖掘可知,“南方策略優化混合型證券投資基金”的基金經理為楊德龍,其還兼任南方旗下數只產品的基金經理。假設通過數據分析發現該投資經理的數個產品存在非常明顯的交叉持股現象,那么我們有理由來預測該投資經理旗下的其他產品(盡管沒有披露在公司前十大股東之列)也會因徐翔事件受到波及。通過大數據的方式,全面系統地展示徐翔概念股及背后的產品和觸雷的投資經理等,將會形成一幅信息量非常巨大的動態觸雷圖譜,甚至還能預測公開數據之外的一些信息,這就是大數據的魅力。
以上案例均從公開網站、媒體、上市公司公開信息披露等渠道獲取情報信息,我們不做其真偽度的判斷,只是假設其真實存在,推演出來的一套系統邏輯。本文的初衷還是試圖從研究私募基金管理人的視角,以大數據的方式來探秘股市黑天鵝。目前,國金涌富資產管理公司已通過數據運算生成一些工具和產品,正在進行小范圍內測,例如上述專注研究基金管理人的觸雷圖譜就可實現實時查詢,一鍵生成報告,非常靈活方便。國金涌富表示,后續還將不斷增加大數據方面的投入,建立知識圖譜并完善機器學習能力。公司立志于資管大數據領域地深入挖掘和探索,助力中國私募基金行業的健康發展。