時至今日,大數據不再是虛無縹緲的概念,它已經展現出強大的“未卜先知”的能力。
2014年高考,百度用大數據技術預測命中全國18卷中12卷高考作文題目,網友戲稱“神算子”。而在2014年巴西世界杯,谷歌的云計算平臺通過大數據分析準確地預測了16強和8強,比“章魚哥”更強。
如果把這種預測能力應用在股票投資上,對投資者來說是不是很有吸引力?毫無疑問,肯定是的,誰都不愿意去做“高倉健”(高位建倉)、“蒼井空”(滿倉踏空)。
現在,券商和掌握大數據資源的互聯網公司已經在行動,有投資者嘗到了甜頭,也引起了更多財經類網站的跟風。
一波大數據理財襲來
互聯網巨頭跨界進入
李斌是一位金融圈內人士,去年10月他“秒殺”了百度百發100指數基金。到上周,該產品的回報率達到18%,這樣的回報率超出他手中持有的任何一只理財產品。李斌之所以選擇百度百發,看中的正是百度的大數據選股優勢,他相信這樣的大數據理財產品有能力做到高收益、低風險。
去年10月,百度聯合廣發基金推出國內首個互聯網指數基金“百發100指數基金”,很快就售罄。從很大程度反映了投資者對大數據金融產品的歡迎。
在互聯網圈,像百度這樣試圖通過借助手中的大數據跨界進軍金融業的公司不在少數。目前市場上可見的有新浪與南方證券合作的大數據100、大數據300指數,中證指數與騰訊濟安金信推出的中證騰安指數,以及阿里旗下螞蟻金服推出的淘金100指數等等。盡管,他們各家推出的金融產品性質不盡相同,但背后的模式卻大同小異:由互聯網公司提供海量的信息數據,券商、指數公司負責提供專業模型搭建,以及合法的銷售渠道。
以新浪為例,他們的數據來源主要是新浪微博,以及新浪財經,通過內部的輿情分析技術來定期追蹤用戶關注度最高的50只股票,并根據相關模型篩選,納入決策范圍。“比如,上星期五早盤,我們注意到微博輿情中出現大量有關杭州解百、廣州友誼、南寧百貨的負面情緒,并且在加速傳播,在股市開盤前的4個小時之內,關注量幾乎占據了前50只股票總量的一半,我們將這一異常情況反映給了基金合作方。果然,在當天大盤走勢強勁的情況下,這三只個股表現十分弱勢。進一步分析,我們發現這與微博上傳播的‘馬云打敗地產商或成現實:商鋪已是最危險資產’信息有十分直接的聯系。”在新浪財經事業部的相關負責人看來,任何“大數據”都會體現數據源特色,而他們目前要做的是如何消化這些數據能力,去識別基于輿情的機會與風險。“2014年12月9日,股市黑色星期三,上午暴漲4%后午盤跳水到5%,一天的震幅近10%。我們在上午12點就已經從輿情中發現了新聞主題聚類排序第一的是‘爆倉風險’‘中證登加碼封殺地方債’,及時采取了風險防控。”
及時應變是大數據指數基金不同于傳統基金的另一大賣點。無論是百度百發,還是新浪大數據系列產品,他們的成分股調倉周期均為一個月,在開發者看來,與傳統基金半年的節奏相比,這樣更有助于把握市場節奏,不錯失捕捉超額收益的機會。
與新浪相似,百度百發同樣是根據“綜合情緒模型融合三層數據”,最終選取排名前100的股票作為百發100指數的成分樣本股。從實盤運行階段看,選出的第一大重倉行業已明顯超越了同一類的申萬行業指數。“截至2014年9月30日,其漲幅為41.35%,顯著跑贏了市場核心指數。從6月到9月,成分股漲幅均超申萬行業指數3~8個點。”百發一位技術人員透露。
傳統財經網站心動
向互聯網金融轉型
大數據理財產品熱,不僅僅在理財圈引起了關注,更是在互聯網行業激發了轉型熱。一位財經類門戶人士坦言,他們內部也一直在研究百度百發大數據指數產品,希望能借力大數據,推動自身轉型。
作為財經類大數據掌握者,財經類資訊網站首當其沖,因為與新浪財經、百度相比,傳統財經類門戶網站手中的用戶群顯然更垂直。 “有用戶就可以變現。我們考慮的也是如何通過大數據實現流量變現。”東方財富網一位負責人透露,東方財富網作為財經類第一大門戶,前兩年市值達到一兩百億了,但公司業績卻不突出,“每年也就幾百萬的盈利,就是一個流量變現的問題。”
這位人士坦言,在此之前,很多財經類互聯網公司基本只用大數據做內部輔助,觀察流量的變化,觀察用戶,包括在網站上的停留時間、瀏覽軌跡等。技術部門會定期提供基于后臺和大數據分析,反饋給前臺做一些參考,真正用于商業價值變現非常少。“百度百發指數本身也沒有商業價值,關鍵拿這個指數和廣發基金合作,做了一款產品,這才發揮了商業價值。”
目前,東方財富網也在嘗試轉型,在其首頁可見大數據分析類產品的雛形。“我們也在嘗試推出基于大數據分析類的參考產品,比如,choice數據是針對機構提供大數據分析類報告,而面對普通用戶的是‘東方財付通’。”
事實上,借著大數據的東風,和訊、金融街等傳統財經網站都在向互聯網金融轉型。一家垂直類財經門戶網站的相關人士透露,他們也在嘗試基礎的數據挖掘,“我們根據用戶對股票基金、貨幣基金的關注度進行數據分析和挖掘,然后和基金公司來分享,看看能不能打造一些更適合的產品。”
不過由于大數據挖掘本身具有極高的技術門檻,因此大部分財經資訊網站的數據挖掘依然停留在指向性建議,而無法在用戶具體決策過程中起到關鍵作用。“比如基金公司要發行針對行業的基金產品,我們可以為他們提供數據分析,比如用戶對哪個行業的關注度更高。至于更深的數據挖掘,很難做。”東方財富網相關負責人表示,除了百度作為搜索門戶,具備搜索挖掘技術背景外,大部分網站其實只能基于海量用戶,做一個相對粗放型的分析,距離成熟還差很遠,更多的還是基于經驗,不過未來的方向,一定是大數據的挖掘深度與變現能力直接掛鉤。
國內外尚未有成熟模型
大數據金融仍待時間檢驗
雖然目前大數據類指數基金表現不錯,但是一些業內人士認為,大數據選股的有效性需要時間的檢驗。
在一位傳統指數基金經理看來,大數據選股首先追逐的都是熱點股,在牛市中追漲殺跌也許可行,但在熊市中可能會失靈,因為要面臨反復止損的情況。
在他看來,目前大數據類指數基金的高收益與身處牛市有關。
事實上,即便是美國也沒有一套十分成熟的大數據金融類產品。“找到數學上的方法不一定有效。只有經歷過幾個經濟周期,以及股市大漲大跌之后,依然非常堅挺,表現非常好的模型,才能說是穩定的,值得長期投資的。”
在金融工程學專家郝志遠看來,每一種分析方法都有優劣,而大數據金融本來就是一個跨行業的新興產業,涉及IT以及金融,需要在這兩個行業同時具有深厚的研究水平和實踐經驗是非常難的。從這一點看,國內大數據金融人才嚴重匱乏,“國內能做到這一點的人,我估計連千人都不會到,而他們大多在大型金融機構的中控部門,或者在私募提供高端選股服務,這些人的年收入不會低于千萬級水平。”
此外,從客觀大環境看,中國資本市場上的數據并不充沛,據一位業內人士透露,他們曾經嘗試就中國股市搭建數學模型,但反復推論,都發現數據和結果無法相互印證,很多結果都存在問題,“最后發現更大的可能就是原始數據有問題,原因還是國內數據市場化不夠。”
當然,大數據金融會是未來的主流方向,這一點沒有人會懷疑,“比如大數據去找一些公開信息里的蛛絲馬跡然后讓我可以有效地發現一些符合我本身交易習慣與邏輯的機會,我覺得會是一個好的工具。”在上述傳統基金經理看來,憑借大數據的還是聽自己經驗,在現在看來,沒有對錯,這只是一個信仰問題,但如果能將兩者有機結合,或許能發揮更大價值。
國內外大數據基金指數、基金
名稱 互聯網數據來源 基金公司 指數公司 產品性質
百發100 指數 百度財經 廣發基金 中證指數 指數基金
大數據100 新浪財經 南方基金 深圳證券信息公司 指數
大數據300
騰安指數 騰訊 濟安金信 中證指數公司 指數
淘金100 支付寶 恒生聚源數據服務有限公司 中證指數公司 指數
Derwent Capital Twitter 對沖基金
Markets