廣發基金旗下的廣發中證百度百發策略100指數基金日前獲批,擬于10月20日發行,這將是國內首只運用大數據的指數基金。此前,由新浪財經、南方基金和深證信息公司聯合推出的大數據策略指數i100和i300已于9月12日在深交所掛牌。
植入了互聯網大數據基因之后,這些指數將以往難以觸摸的市場情緒量化并加以表達,而它們究竟能為投資加分多少?大數據背后又有哪些秘密?
超額收益來自三大數據“化學反應”
朋友聚會上,一位炒股達人順口推薦了幾只股票,平時也買點股票的你,事后想起不免先打開百度搜索,將這幾只股票研究一番。
不過,此時你是否會想到,自己這一舉動如今已經如同蝴蝶效應一般,可以影響到某只指數、某只基金的漲跌了?
“當投資者面對市場海量信息的時候,其關注度就是一個稀缺資源。”廣發基金百發100研發人員季峰對第一財經日報《財商》(微信號:Caishang02)記者說,百發100對互聯網大數據的應用實際上就是基于金融學上“有限關注度”的理論。
具體來講,只有先發生了投資者的有限關注,才會有相應的網絡搜索行為,這種大數據更為直接和精確地反映了投資者對具體某只股票的關注程度。
但是,單靠互聯網大數據也很難獲得超額收益。據季峰介紹,在百發100之前,研究團隊曾經試著單純用大數據做了一個類似的指數產品,但這只指數表現并不好,歷史模擬收益跟滬深300指數的收益基本持平,意義不大。
“要真正獲得超額收益,還需要加入其他兩類量化產品常用的數據,它們三者產生的"化學作用"讓我們感到驚訝。”季峰說,該模型除了運用百度提供的用戶搜索和行為數據指標之外,還融入了8個財務指標的財務因子、動量因子和動量反轉策略兩大數據,將這三大數據輸入到BFS模型,篩選出100只基本面好、成長空間良好,能反映未來一個月內市場行業輪動熱點的股票。
“簡言之,就是把投資者決策行為的前半部分和后半部分的數據相結合。”廣發基金數量部總經理、百發100擬任基金經理陸志明對記者說。
這三大數據的“化學反應”結果如何呢?
從歷史數據看,百發100指數自發布以來表現不俗。累計收益方面,百發100自2009年以來已經取得了545%(截至2014年6月30日)的收益,遠高于同期滬深300指數19%的收益,更高于上證綜指的12%,也遠勝全市場業績基準中證全指56%的累計收益。
此外,截至9月24日,百發100指數今年以來漲幅已達47.42%。
同樣含著大數據“金鑰匙”出身的還有大數據策略指數i100和i300,該指數的亮點是南方基金與新浪財經合作,運用新浪財經在大數據方面的優勢,分析當下市場中投資者關注的熱點和焦點,之后結合財務因子和市場驅動因子,通過量化模型進行優化,選定成份股。
從歷史數據上看,這兩只指數表現同樣大幅超越大盤,2010年1月29日至2014年9月12日,i300漲幅超過180%,i100漲幅超過290%,同期滬深300指數下跌了近24%。
此外i100今年以來則累計上漲了35.56%。
散戶市場大數據更有效?
“大數據指數還是一個新生事物,從國內外來看目前都還沒有成功的先例。”好買基金一位分析師對記者說,大數據策略是否繼續維持此前的歷史業績長期有效,仍需未來表現予以證明。
據悉,目前海外對搜索數據在資本市場的實戰應用,尚無典型案例可供參考,但基于互聯網搜索數據的社會經濟行為預測研究,已逐漸成為一個新的學術熱點。在資本市場應用研究上,海外就有學術研究指出,公司的名稱或相關關鍵詞的搜索量,與該公司的股票交易量正相關。
“現在國內公募基金在某些方面并不比國外落后。”陸志明說,而將互聯網大數據運用到投資上,國內的數據可能會比海外更有效。
事實上,不管是百度還是新浪財經的互聯網金融大數據,從某種意義上看都是度量投資者情緒的量化方法之一,可用它反映投資者的投資意愿或預期。而開發這類指數的機構認為投資者情緒在A股證券定價中具有重要作用。
陸志明解釋道,由于A股當前仍然是一個以散戶為主體的市場,個人投資者較多,而個人投資者在做投資決策之前會更多地運用搜索引擎這類工具去查找資料,因此,互聯網上的投資者行為數據更能反映大部分投資者的情緒,這也是百度100發布以來能夠獲得超額收益的原因。
“大數據確實是一個大金礦,現在我們運用到的只是其中很小一部分,未來包括行為數據、利好跟利空篩選等我們都希望能夠運用到投資中來。”季峰說。
大數據指數有哪些風險?
百發100每個月會進行一次調倉。據介紹,百發100從6月20日以來進行的3期運作過程中,基本上每期都有50%的股票會被換掉,高比例的調倉加上當前的高收益,百發100是否會成為一只追漲殺跌的指數基金?
季峰對此解釋道,以6月20日這一期百發100的成份股為例,創業板股票占5%,中小板股票占20%~30%,滬深主板股票則占了60%多。
“從這個比例構成上看,百發100不是一只小票風格的指數。”季峰表示,如何避免追漲殺跌,在做模型的時候就已經考慮到了,通過三大數據的結合,一些遭遇市場熱炒過的、有基本面風險的股票都已經被“過濾”了。
“我們更希望通過這三大數據和模型,找到一些未來有一定漲幅空間、契合未來一個月市場或者行業熱點的股票,而不是追漲殺跌的短期個股。”陸志明表示。
此外,有分析師也指出,在大數據指數基金推出前期,投資者獲取超額收益的可能性會高一些。但是,隨著日后市場模仿此策略的產品增加,也可能導致超額收益下降,這跟市場上量化基金同質化的風險類似。
不過,陸志明稱,基金成立后一旦業績持續走好,由于國內投資者都比較短線,恐怕會遭遇大量的贖回,這是當前最擔心的。
“百發100指數跟蹤的標的能否承載得住單日大量的贖回,這是我們運作上要重點考慮的。”陸志明說。