克托·邁爾-舍恩伯格在《大數據時代》一書中寫到,大“數據”的核心就是預測,即只要數據豐富到一定程度,就可預測事情發生的可能性。眼下,大數據正穿越至理財界,把“未卜先知”的觸角伸向股票投資領域
“大數據投資”賺足眼球
國內目前的“大數據投資”運作模式大同小異,一般是由互聯網公司提供海量的信息數據,券商、基金等金融機構負責搭建專業的數學分析模型。
在國內互聯網圈,試圖借助手中的大數據跨界進軍金融界的公司不在少數。目前,市場上可見的例子有新浪與南方證券合作的大數據100、大數據300指數,中證指數與騰訊濟安金信推出的中證騰安指數,阿里旗下螞蟻金服推出的淘金100指數等。而國內首只互聯網指數基金出現在去年10月,百度聯合廣發基金推出了廣發百發100指數基金,首募第一天認購超13億,第二天上午就達到18億元的首募上限。
盡管這些打著“大數據”旗號的各式指數令人眼花繚亂,但背后的模式大同小異——由互聯網公司提供海量的信息數據,券商、基金等金融機構負責搭建專業的數學分析模型。南方-新浪I100和I300是由南方基金、新浪財經和深圳證券信息公司三方聯合編制的,數據來源主要是新浪微博以及新浪財經,包括用戶在新浪財經對行情的訪問熱度、對股票的搜索熱度,用戶在新浪財經對股票相關新聞的瀏覽熱度,股票相關微博的多空分析數據等等。通過一套分析技術,定期追蹤用戶關注度最高的50只股票,再根據相關模型篩選,結合財務因子和市場驅動因子,最終選出成份股。
百度百發同樣是根據“綜合情緒模型融合三層數據”,選取排名前100的股票作為百發100指數的成分樣本股。百度金融中心相關負責人表示,“與同期滬深300指數的表現相較,百發100更能在股票市場振蕩時期、行業輪動劇烈時期、基本面不明朗時期抓住市場熱點、了解投資者情緒、抗擊投資波動風險。”
此外,阿里巴巴旗下的天弘基金也有意在大數據策略上做文章。天弘基金機構產品部總經理劉燕曾對媒體表示,“在傳統的調研上,大數據將貢獻于基礎資產的研究,而以往過度依賴線下研究報告。大數據將視野拓展至線上的數據分析,給基金經理選股帶來新的邏輯。”
及時應變是大數據指數基金不同于傳統基金的另一大賣點。無論是百度百發,還是新浪大數據系列產品,他們的成分股調倉周期均為一個月,在開發者看來,與傳統基金半年的節奏相比,這樣更有助于把握市場節奏,不錯失捕捉超額收益的機會。從記者查到的公開數據看,廣發百發100指數的投資范圍是保持不低于90%的股票,截至去年年末,其股票倉位為94.52%,成立以來回報率為17.30%,最新基金規模為29.97億元,基金份額為11.27億份,和上季度相比,變化率為6.55%。
“捕捉市場情緒”是強項
回顧股票投資的歷史,其實就是把影響股價的因子不斷量化的過程。計算機通過分析新聞、研究報告、社交信息、搜索行為等,借助自然語言處理方法,提取有用的信息;而借助機器學習智能分析,過去量化投資只能覆蓋幾十個策略,大數據投資則可以覆蓋成千上萬個策略。
眼下,基于互聯網搜索數據和社交行為的經濟預測研究,已逐漸成為一個新的學術熱點,在經濟、社會以及健康等領域的研究中取得了一定成果,而應用到資本市場應用上,研究發現搜索數據可有效預測未來股市活躍度(以交易量指標衡量)及股價走勢的變化。不過,在大數據技術嶄露頭角前,市場情緒始終很難準確量化。業內人士指出,包括百發100在內的大數據理財產品其實是在傳統量化投資技術上,融合了基于互聯網大數據的市場走勢和投資情緒判斷。
眾所周知,傳統的量化投資主要著眼點于對專業化金融市場基本面和交易數據的應用。和傳統量化投資類似,百發100對樣本股的甄選要考慮財務因子、基本面因子和動量因子,包括凈資產收益率、資產收益率、每股收益增長率、流動負債比率、凈利潤同比增長率、股權集中度、自由流通市值以及最近一個月的個股價格收益率和波動率等等。
當然,在百發100的策略里,無論是來源于專業金融市場的結構化數據,還是來源于互聯網的非結構化數據都是可以利用的數據資源,通過大數據捕捉市場情緒,包括來源于互聯網的用戶行為、搜索量、市場輿情、宏觀基本面預期等等,成為了百發等互聯網公司的技術“利器”。事實上,時至今日大數據已經展現出強大的“未卜先知”的能力。在2014年巴西世界杯,谷歌的云計算平臺通過大數據分析準確地預測了16強和8強,比“章魚哥”更強。百度金融中心相關負責人表示,與歐美等成熟資本市場主要由理性機構投資者構成相比,東亞尤其是中國的股票類證券投資市場仍以散戶為主,因此市場受投資者情緒和宏觀政策性因素影響很大。而個人投資者行為可以更多地反映在互聯網用戶行為大數據上,從而為有效地預測市場情緒和趨勢提供了可能。
記者了解到,單靠互聯網大數據也很難獲得超額收益。在百發100誕生前,研究團隊曾經試著單純用大數據做了一個類似的指數產品,但這只指數表現并不好,歷史模擬收益跟滬深300指數的收益基本持平。要真正獲得超額收益,還需要加入其他兩類量化產品常用的數據。該模型除了運用百度提供的用戶搜索和行為數據指標之外,還融入了8個財務指標的財務因子、動量因子和動量反轉策略兩大數據,將這三大數據輸入到BFS模型,篩選出100只基本面好、成長空間良好,能反映未來一個月內市場行業輪動熱點的股票。
[page]還有不少短板
在投資領域,即使是在美國這樣的成熟金融市場,大數據策略投資的應用目前還僅限于中小型對沖基金和創業平臺公司。
畢竟尚屬新興事物,大數據的預測能力依舊存在不少的缺陷。就拿鼎鼎大名的谷歌來說,網站在2008年推出的流感趨勢系統監測全美的網絡搜索,尋找與流感相關的詞語,比如“咳嗽”和“發燒”等。它利用這些搜索來提前9個星期預測可能與流感相關的就醫量。但在過去幾年中,該系統一直高估與流感相關的就醫量,在這類數據最有用的流感季節高峰期尤其預測不準確。在2012/2013流感季節,它預測的就醫量是美國疾控中心(CDC)最終記錄結果的兩倍;在2011/2012流感季節,它高估了超50%。
在投資領域,即使是在美國這樣的成熟金融市場,大數據策略投資的應用目前還僅限于中小型對沖基金和創業平臺公司。相關分析師指出,在大數據指數基金推出前期,投資者獲取超額收益的可能性會高一些。但隨著日后市場模仿此策略的產品增加,也可能導致超額收益下降,這跟市場上量化基金同質化的風險類似。
當然,大數據金融仍是未來的主流方向,這一點沒有人會懷疑。上海財經大學現代金融研究中心副主任奚君羊表示,以大數據為特征的百度百發面世,具有必然性。一方面,隨著國內股市行情的向好,股民及用戶的關注度提升,成為互聯網公司進入證券業的較好機遇和時機。另一方面,互聯網金融在基金、銀行等領域已經有一定的發展,但在證券業幾乎還是空白點,也使得互聯網公司進入證券業成為“圈地式”必然。從嚴格意義上來說,互聯網金融是指互聯網企業向金融業的滲透,不是簡單的利用互聯網渠道來做金融業務,包括證券業務,而是找到互聯網與證券業的一個“結合點”,將互聯網基因真正植入到產品設計與服務中去。從這點來看,百度股市通中的大數據運用,是具有開創性意義的。
■鏈接 “大數據投資”怎么玩
隨著互聯網、云計算等各式前沿技術的迅速發展,國外已經涌現出不少運用“大數據”玩轉投資的互聯網公司,盡管它們的先鋒做派尚未贏得傳統金融界的完全認可,但卻已經日益嶄露頭角。
Kensho
Kensho推出的全新數據分析工具——Warren類似于投資版的“Siri”,可以快速整合海量數據進行分析,回答投資者提出的各種金融問題,例如“下月有颶風,將對美國建材板塊造成什么影響?”
Kensho的系統由幾位來自谷歌和蘋果的資深軟件工程師開發,如同天氣預報那樣,Warren會不斷優化模型、灌入海量信息,然后給出結果。在其處理的信息中,有80%是“非結構化”數據,例如政策文件、自然事件、地理環境、科技創新等,這類信息通常是電腦和模型難以消化的。就在去年底,美國高盛向Kensho公司投資1500萬美元,以支持該公司的大數據平臺建設。
Market Prophit
金融大數據分析公司Market Prophit的做法是從社交網絡中的“噪音”分析出市場“信號”。Market Prophit認為,市場情緒及氛圍可以對金融市場產生一定的影響,推出一個社交情緒分析平臺,可以幫助投資者準確把握市場的脈搏。由于采用了先進的語義分析法,MarketProphit可以將Twitter(推特)里的金融對話量化為“-1(極度看空)”到“1(極度看多)”之間的投資建議。網站根據語義量化,每天公布前十名和后十名的股票熱度榜單;還設計了“熱度地圖”功能,根據投資者情緒和意見,按照不同板塊,將板塊內的個股按照顏色深淺進行標注,誰漲誰跌一目了然。
Derwent
對沖基金Derwent的投資策略是通過實時跟蹤推特用戶的情緒,以此感知市場參與者的“貪婪與恐懼”,從而判斷市場漲跌來獲利。在Derwent的網頁上可以看到這樣一句話:“用實時的社交媒體解碼暗藏的交易機會。”
在美國市場上,目前有多家私募對沖基金利用推特和Facebook(臉書)的社交數據作為反映投資者情緒和市場趨勢的因子,構建對沖投資策略。比如,一家位于美國加州的對沖基金MarketPsych與湯森路透合作提供了分布在119個國家不低于18864項獨立指數,比如每分鐘更新的心情狀態(包括樂觀、憂郁、快樂、害怕、生氣,甚至還包括創新、訴訟及沖突情況等),而這些指數都是通過分析推特的數據文本,作為股市投資的信號。
StockTwits
利用社交媒體信息做投資的公司還有StockTwits。打開這家網站,首先映入眼簾的宣傳語是“看看投資者和交易員此刻正如何討論你的股票”。這家網站相當于“股票界的推特”,主要面向分析師、媒體和投資者。它通過機器和人工相結合的手段,將關于股票和市場的信息整理為140字以內的短消息供用戶參考。此外,StockTwits還整合了社交功能,作為插件可以嵌入推特、臉書和LinkedIn等主要社交平臺,讓人們可以輕易分享投資信息。