移動互聯、云計算等層出不窮網絡概念改變著民眾的生活,6.32億的PC網民、5.27億的手機網民每天都在產生大量的網絡數據,購物、交流、視頻、圖片等構成的數據海洋被視為IT發展的下一個藍海,大數據逐漸流行。那么,大數據的價值究竟幾何,本文以南方新浪財經大策略指數為例拋磚引玉。
緣起:數據價值——定位與效率
大數據的價值體現在其精準的客戶定位以及效率的提升。關于大數據的最早案例發生在美國第二大的超市塔吉特百貨(Target)。故事是這樣的,有一天該超市基于數據挖掘系統分析結果給一位高中女生寄去嬰兒用品優惠券,其父親發現后投訴Target誤導未成年人,但卻在之后了解到他女兒已經懷孕的事實。
目前國內對于大數據挖掘的利用主要集中在對個人網絡足跡的還原,刻畫出個體的消費偏好、性格取向甚至是信用等級,通過模型化之后為電商公司或者是網絡信貸公司提供精準推銷,提高銷售效率。而實際上根據麥肯錫的研究結果總結,大數據不只是可以對顧客群體細分,然后對每個群體量體裁衣般的采取獨特的行動,還可以做到諸如運用大數據模擬實境,發掘新的需求和提高投入的回報率;提高大數據成果在各相關部門的分享程度,提高整個管理鏈條和產業鏈條的投入回報率;進行商業模式、產品和服務的創新等。而在產品創新如火如荼的金融行業,也將大數據工具納入其中。
他山之石:互聯網時代 在數據交易中實現投資價值
從國外的經驗來看,大數據工具主要通過兩個方面切入金融:一個就是將數據平臺作為渠道來銷售金融產品,比如美國的Paypal、國內的余額寶[微博]、91金融超市等;另外一種就是通過整合互聯網中的散碎信息,來預測股市的走向或者發現具備投資價值的個股。比如由英國華威大學金融學副教授托拜厄斯·普賴斯、倫敦大學計算社會科學家海倫·蘇珊娜·莫特以及美國波士頓大學物理學家哈瑞·尤金·斯坦利撰寫的《金融市場上的量化交易行為》便是基于這種思路來探索金融投資的。
報告中對2004年至2011年期間谷歌[微博]搜索中98個關鍵詞,比如“營收”、“失業”、“信貸”和“納斯達克[微博]”的搜索頻率變化進行了分析,研究證明:在金融市場下滑之前,可能會先出現投資者對市場擔憂的一段時間。投資者在準備以較低價格拋售股票之前,可能會先搜索更多有關市場的信息。反之,金融關鍵詞搜索量下降可以作為股市隨后上漲的信號。這三位學者證明,以谷歌搜索平臺上“債務”這個關鍵詞的搜索量為基礎建立起來的短線交易策略,在2004年至2011年期間可帶來高達326%的累計回報。
數據與基金的聯姻 —南方新浪財經大數據策略指數
2012年5月,世界首家利用 Twitter 的對沖基金金 Derwent Capital Markets上線,在八月份的報道中顯示,該基金在首月交易中已經盈利,它以1.85%的收益率,超過平均數只有0.76%的其他對沖基金。此次南方基金和新浪的聯姻代表了指數基金產品創新和策略投資的新方向
該策略指數基金的構建原理是通過對新浪在財經領域的“大數據”定性與定量分析,找出股票熱度預期、成長預期、估值提升預期與股價表現的同步關系,構建策略因子,精選出具有超額收益預期的股票。通過基金公司專業股票研究優勢與互聯網“大數據”結合,從而最大程度提升和實現數據的量化價值,回饋投資者。
從目前進展來看,前期南方數量化投資部通過對財經大數據的分析,發現追蹤市場熱點變化,結合南方量化研究成果,挑選出更具有投資價值股票作為投資組合,日前已經完成了綜合寬基指數、主題行業指數的歷史模擬業績測算。內部測算結果顯示,該指數具有較好的市場代表性、收益性和流動性。相信兩者的合作將會互聯網與傳統金融的結合推升到一個更高的層次。
意義:超越傳統量化 公募產品創新的新紀元
而新量化方法,或者說互聯網大數據策略分析之所以能產生投資價值的理論背景是行為金融學在投資指導上的具體化。該理論認為有效市場假說存在不合理性,投資者不都是“理性人”,行為和情緒因素以在金融決策中起較大作用,決策者的偏好一般是多方面的、易變的,這種偏好常常只在決策過程中才形成。總的來說行為金融以觀察的角度來研究市場參與者表現出的真實情況是什么樣的,通過“發現”來解釋金融現象,最后試圖形成模型來預測市場。傳統的量化投資者由于數據獲取局限,研究更多的止于事件本身對于股價的影響,數據量極其有限,對于新聞事件所帶來的互動信息數據研究更是嚴重缺位。新浪和南方的合作很好的填補了這一空白。
任何投資都要創造價值,否則無意義。無論是行為金融研究還是大數據投資,其根本目的還在于最大程度的接近市場、還原市場本身的樣子去進行有效的投資,最大程度實現資本市場投資收益。作為第一個吃螃蟹的人,我們期望雙強合作帶來不斷的驚喜,除了主題新穎,更要物有所值,這才能成為公募基金量化投資上歷史上的新標桿。