5月28日,當上證指數以重挫6.5%結束一天行情時,網絡上到處彌漫著恐慌與迷茫的情緒。就在投資者在堅守和撤離之間難做抉擇之時,有一種軟件已在后臺搜集這些情緒數據,并進行量化分析,形成具體的投資意見。這就是美國華爾街投行、對沖基金、甚至紐約證券交易所都在使用的社交網絡股市情緒量化分析法。
我國的股市情緒量化分析,也隨著股票雷達、投資脈搏以及百度股市通等應用的出現,進入了起步階段。在大市走向震蕩加劇的當下,將感性的情緒量化為理性數據,不失為投資者縱觀全局的參考指標。
2015年4月,總部位于波士頓的對沖基金Tashtego宣布,將依靠數據算法,利用社交網絡分析客戶情緒和投資者行為進行交易。這則消息,向大眾揭開了華爾街使用的情緒量化分析法的神秘面紗。
實際上,從2013年美國證監會(SEC)允許上市公司在社交網絡披露公司信息起,美國股市情緒分析應用如雨后春筍般冒出,華爾街投行、對沖基金等紛紛加入到這股互聯網金融浪潮中。
社交數據分析公司受追捧
2013年3月8日,紐約數據分析公司Dataminr(數據礦工)的客戶收到一條緊急推送,稱一艘皇家加勒比海游輪抵達佛羅里達的埃弗格萊茲港,船上的105名乘客和3名船員全部感染諾如病毒(常見伴隨癥狀是食物中毒和腹瀉)。這則經確認的新聞剛公布,皇家加勒比海游輪公司的股價旋即急跌2.9%。Dataminr的客戶在新聞公布前48分鐘即得知此事件。
引起Dataminr員工警覺的,是南佛羅里達新聞電臺WSVN于當天下午1點發布的一條推文。“我們心中警鈴一震”,Dataminr公司創始人彼得·貝利說,后臺語義算法系統發現這條推文與曾經產生過類似價值的信息行文類同。當天下午1點02分,即該推文發布兩分鐘后,Dataminr公司的相關客戶就收到一封警示郵件。
上述Dataminr提供的服務,不過是美國近幾年社交網絡股市情緒分析浪潮中的一例。
諸如Social Market Analytics(社交市場分析公司SMA)和Hedge chatter等公司都以Twitter、Facebook等社交網絡大數據為基礎,收集并分析網絡上對上市公司或某一事件的看法評論,并作出與股價有關的預測分析。
全球最大社交數據提供商GNIP2014年發布白皮書指出,社交網絡股市情緒分析最早始于2010年,用途還只限于企業分析客戶感受。2013年,美國證監會(SEC)允許上市公司在社交網絡披露公司信息后,包括湯森·路透、彭博社在內的全球著名數據提供商也開始提供社交網絡數據分析服務。
面向機構和個人的相關應用如雨后春筍般冒出。Dataminr創始人彼得·貝利透露,他們的客戶就包括華爾街前5大超級投資銀行中的3家,和一家估值150億美元的股權避險基金公司。
SMA與全球領先的數據分析商Markit合作,向超3000家機構投資者提供信息,里面就包括中央銀行、華爾街投行、對沖基金、政府機構和保險公司等。值得注意的是,SMA甚至打入了交易所內部,向美國紐約交易所用戶訂閱欄目提供實時數據分析結果。
理論基礎和數據池更成熟
對市場情緒的分析早有理論基礎。2002年,心理學家丹尼爾·卡納曼和經濟學家弗農·史密斯因對結合了心理學和經濟分析的行為經濟學的研究,分享了這一年的諾貝爾經濟學獎,讓這一細分學科在沉寂了幾十年后真正走進了公眾視野。
2010年,美國印第安納大學和英國曼徹斯特大學的三位學者合作發表了一篇題為《Twitter情緒預測股市》的論文,指出基于大量推文而分析出的公眾情緒與道瓊斯工業指數相關聯,甚至具有預測性。
他們選取2008年2月28日至12月19日近1000萬條推文作為樣本,采用兩種情緒追蹤工具將其分類。一種是開源工具OpinionFinder,將推文二分為積極和消極情緒;另一種是以臨床醫學使用的情緒狀態量表(POMS)基礎而新開發的情緒測試工具GPOMS,能將公眾的情緒分為冷靜、警惕、確信、活力、友善和幸福這六個類別。
研究者發現,將“冷靜”情緒指數后移3天,竟然與道瓊斯工業平均指數驚人一致,也就是說,Twitter反映出的情緒能在一定程度上預測3~4天后的股市變化。另外,研究者還測試了一個稱為SOFNN的股市預測模型。當僅輸入股市數據時,模型已經有73.3%的準確率;加入“冷靜”的情感信息后,準確率更升至86.7%。
分析軟件如何在全球每天數百億推文中篩選有效信息,成為量化市場情緒的關鍵,專業的算法成為篩選有效信息的利器。
對相對成熟的美國公司來說,其能利用的數據池非常廣泛。《每日經濟新聞》記者注意到,Dataminr、SMA和Hedge chatter三家業界主力的信息來源分為兩種。
一種是依托全球最大專業數據提供公司英國DataSift(數據雨燕)和美國GNIP。DataSift數據池共有超過21家網站,擁有強大的信息過濾算法,每秒能挖掘12萬條推文,數據池除了主要的Twitter、Facebook、Wordpress和Tumblr外,還有圖片社交網站Instagram、視頻分享網站Youtube和Dailymotion等,其中Datasift還取得了新浪微博、騰訊微博的資源授權。
二是公司用自己的語義分析法對數據進行細分。例如SMA鎖定超過30萬的專業投資者,這部分人密切關注資本市場動向,有規定地發布股市推文。因此成為SMA數據庫的基礎來源,并每月自動篩選替換。
國內篇
A股情緒量化分析剛起步 深度待提高
每經實習記者 黃修眉
在國內,首款情緒分析軟件股票雷達已面世三年多;基于印第安納大學研究成立的投資脈搏網站推出心情指數,直觀感受股市情緒與大盤變化走勢;基于百度搜集大數據的百度股市通也公布了不俗的成績,我國的股市情緒量化分析已在起步。
作為2012年就利用社交情緒預測股市的公司,股票雷達創始人馮月在接受《每日經濟新聞》記者采訪時表示,股票雷達中的雷達關注功能是一款針對A股的個股資訊聚合分析工具,它通過捕捉全網各類股票資訊,統計網絡中所有人的看漲看跌觀點,再利用自身大數據技術分析出目前市場整體看好的股票是哪些。
與美國此類軟件數據來源不同的是,馮月向記者介紹,股票雷達后臺數據來源于全網,只要與股票有關的網站,包括微博在內,都是股票雷達分析來源。這主要是因為A股客戶相對分散。《每日經濟新聞》記者注意到,投資脈搏網站的股市心情指數,數據來源于股吧、新浪財經、搜狐財經等,并利用自家的算法程序在社交數據中提取最核心關鍵內容,辨別“漲跌、買賣”等關鍵指標,得出大多數股民對大市的心理預測值,且用戶也能在投資脈搏網站上對當天股票的整體行情評分,取值范圍是從-100~100之間,代表看空或看多情緒的強烈程度。
相較于分析股市情緒的上述兩款應用,除了分析全網股市情緒外,百度在今年2月推出的百度股市通APP還利用了百度的大數據引擎技術,智能分析股市行情熱點,根據百度股市通5月13日公布的數據顯示,百度股市通所有熱點事件股票的上漲概率達78%,股票日均漲幅達1.7%。
馮月向對記者表示,從國內應用提供的服務看,我國的社交網絡情緒分析還處于起步階段,也暫時缺乏健全的市場監管和指導。記者注意到,相較于美國社交網絡情緒分析已深入華爾街,我國的股市情緒分析還有很大提升空間。
美國軟件公司對市場情緒的量化已進入可視化階段,能將一只股票的實時情緒變化走勢形象地表現出來,甚至能將這些數據通過Excel下載并自行統計,其所能達到的直觀效果與分析深度不言而喻。
我國的相關軟件多是一攬子聚合信息服務中的一項,且只涉及后臺分析,向投資者提供市場情緒看漲或看跌的個股,目前還不能像東方財富、同花順等交易軟件一樣,向投資者提供具象數據。
爭議篇
情緒指數非萬能 但有助于理性投資
每經實習記者 黃修眉
情緒跟股市之間的聯系似乎得到了理論的論證,那么在“真刀實槍”的投資行為里,情緒指數是只能做提供分析參考的“助攻者”,還是可以直接指導投資的“得分手”,其預測個股的可靠程度又有多少,國內外對此的爭議從未間斷。
判斷大市優于個股預測
對于個股預測,美國印第安納大學信息科學及計算技術副教授約翰·博倫認為情緒預測大市趨勢比預測個股更有用。
約翰·博倫質疑道,僅僅監測Twitter上的一個子集(如金融板塊),到底有多大價值:“從表面的角度來看,這是一個顯而易見的事情。但你必須問問:為什么有人要針對一只股票發推文,為什么推文比其他指標更有價值?”他補充說,如果你了解一點市場內幕,肯定不會和別人分享。
但博倫也認為,整體的互聯網情緒分析能產生重大收獲。他建立了一家趨勢分析企業,試圖發現“金礦”。他說:“我們在尋找隱藏的社會潛流。”
同校的休伯曼教授呼應了這一觀點:用社交媒體衡量公共情緒,只在整體意義上有用,“除非喬治·索羅斯和沃倫·巴菲特在發微博,否則Twitter用戶并不是那些能夠影響市場走向的人。”
但股票雷達創始人馮月并不認為情緒分析個股有失準確。他說,股票雷達從2012年1月13日開始,每天開盤前都會在新浪微博貼出策略帖,堅持了9個月,最終收益超過40%,而同期大盤大跌。當然,馮月也表示,股票雷達不是股神,也有跌的時候,比如2013年3月它的收益就是-11%。
專業判斷仍不可或缺
美國圣母大學的研究者則質疑社交網絡對突發事件的預測。他們在研究中發現,2008年10月13日,美國聯邦儲備委員會突然啟動一項銀行紓困計劃,令道瓊斯指數反彈,而3天前的Twitter冷靜指數毫無征兆。而且,研究者自己也意識到,Twitter用戶與股市投資者并不完全重合,這樣的樣本代表性有待商榷。
美國特許金融分析師(CFA)協會創新與新興媒體主管萊恩·科斯塔也不贊成Twitter情緒指數的濫用:“對于嚴肅的專業投資者來說,在作出投資決定時,沒有什么可以替代合理的審慎、獨立的專業判斷和由適當的研究與調查支持的基礎。”
在A股市場震蕩加劇的當下,馮月希望股民在做投資決定的時候能越來越理性。他說,股票是一個眾人博弈的游戲,再“精準”的推薦也是有風險的。基于此,他們不是簡單地給出推薦股票,而是會將該只股票的所有相關信息全部呈現給用戶,包括所有看好和不看好這支股票的言論內容,以及這些言論發表者的身份、背景和歷史言論。當用戶了解完所有這些信息之后,他的決定則會趨于理性。