——專訪芝華數據CEO黃勁文
——專訪芝華數據CEO黃勁文
A 大宗商品市場悄然走進大數據時代
在武漢舉行的“第八屆國際玉米產業大會”上,山西一家雞蛋企業透露,長期以來因企業自身規模比較大,對供給端情況的了解是他們判斷和決策雞蛋期貨行情的優勢。而最近兩年,這種優勢卻不知不覺悄然遠去,以至于在隨后的經營決策中失誤連連,企業遭受了很大損失。
其實,遇到這種情況的企業并非一家。黃勁文告訴期貨日報記者:“以前該產業鏈中的飼料企業及貿易商普遍認為,生鮮產品的消費屬于剛需,不容易受外界的影響,所以對需求方面的數據關注不多。”隨著近幾年宏觀形勢不斷發生變化,他們依然沒有意識到自己對需求數據變化的忽略,導致企業頻頻吃苦頭。
而且隨著信息技術和大數據傳播方式的發展,很多原先只有生產商才掌握的數據,其他人也可以通過大數據收集到。就像你不知道一個地區的農場養了多少頭牛,但是你可以查詢當地防疫機構發出了多少只疫苗;你不知道后天廣州現貨市場會有多少雞蛋,但是你可以通過運送生鮮雞蛋的物流公司,可以根據前一天公司接到多少到廣州的雞蛋訂單進行推測。“它在收走傳統產業鏈中一部分人特權的同時,也給更多的人帶來了福利。”黃勁文笑著說,這就是我們講的大數據時代。
B 大數據正在改變大宗商品市場
在大宗商品市場中,供需基本面決定著大宗商品的交易價格,這也是大宗商品市場與權益市場的明顯區別。黃勁文表示,短期內,大宗商品市場雖然也會受到各種熱點炒作的影響,但大趨勢上來看,基本面還是大宗商品交易的決定性因素。
“在大宗商品市場中,無論是生產商、貿易商還是交易者,與基本面相關的數據對他們都尤為重要,但是這些不同類型的數據對使用者來說,價值并不一樣。”黃勁文一邊向期貨日報記者講述,一邊在紙上寫下lagging data(滯后數據)、concurrent data(同期數據)和leading indicator(超前數據)三個詞組。
“以前,基本面相關數據的收集方式大多基于采樣分析,數據大多有一定的滯后性。”黃勁文解釋說,這是因為樣本采集是以最少量的樣本信息來獲取整體的情況,數據精確性與采樣隨機性呈正比。要實現絕對的隨機性十分困難,一旦采樣過程中存在任何偏見,數據分析結果就會相去甚遠。但擴大樣本容量,就要在時間和成本上作出很大讓步。
比如國家人口統計、GDP統計這類數據,雖然相對全面,但滯后時間很長,對金融市場的有效性很低。跟進較快的同期數據,如美國非農就業數據、原油庫存數據,反映的是當月、當周情況,時效性比較高,對金融市場的影響很大。而超前數據,像PMI這種經濟指標具有一定的前瞻性,對金融市場和大宗商品價格的影響也最大。黃勁文一邊用筆圈住concurrent和leading這兩個詞,一邊說:“這就意味著,對我們最有價值的是關于基本面信息的同期數據和超前數據。”
“你記不記得Michael Lewis去年的新作《Flash Boy》?”黃勁文向記者問道,書中也提到高頻交易者通過紐約證券交易所和芝加哥商業交易所做對沖交易的時候,能夠比別人更快地了解到兩個市場之間的關聯變化。由于高頻交易者在光纖等技術方面進行巨額投資,既要在獲得信息速度和信息量上比別人更快、更多,對信息處理的時間也是毫秒必爭。
“就像一些官方在固定時間公布的concurrent data,雖然對未來趨勢不需要過多判斷,但交易者的成敗往往就在毫秒之間。他們比的就是在得到和解讀最新數據上,看誰更快。”黃勁文舉例說,現在美聯儲議息會議的發布,市場的反應幾乎是在消息公布的同一時間發生,這種速度是我們做不到的。因為這種在最短時間內作出相應的反應,依靠的是計算機的“閱讀”和“分析”能力。計算機通過對個別詞組在消息中出現的頻率進行統計,以及與此前會議公告中某些詞組、表達方式出現頻率的對比等,對未來加息進行預判并執行相應的交易。
目前,隨著網絡技術的不斷發展,我們能更快收集并分析更多的數據,不再依賴隨機采樣。這是自動化技術發展給人類帶來的福利,也是大數據時代變革的基礎。在穩定數據采集對象的同時,使數據具備良好的連續性。除了實時數據具有交易價值,連續數據處理后得出的同比、環比以及預估數據,對金融市場也有很強的有效性。
“同時那些你覺得無法找到的數據,其實都可以從一些意想不到的地方提取出來,文字、方位、溝通都可以量化成為結構化的數據。”黃勁文說,在武漢舉行的“第八屆國際玉米產業大會”上,大家都在講玉米的供給,從玉米種植面積、畝產等都可以得到相對精確的數據,但是提起消費數據,大家一時間都覺得無從下手。但是運用大數據思維,我們可以從豬肉、肉雞和雞蛋的貿易量,倒推出生豬和雞的養殖量,再推算出養殖業需要的飼料產量,一步一步預估出玉米的消費量。
C 大數據催生數據服務商的出現
然而,大數據時代在掀起商業和市場變革的同時,也催生了一個全新角色——數據服務商的出現。黃勁文說:“對于數據服務商,從我們公司自身經歷來看,在2010年前后,國內投資者更多的還是看大數據的理念、未來前景和潛在的發展空間。如今,大數據已經開始進入試產了。”
據黃勁文介紹,現在數據服務商已經可以將非結構化數據匯集起來,將其量化處理為結構化的信息,并對這些信息、數據進行重組和擴展之后,再針對不同終端需求重新打包發出。
其實,相比于現貨市場,期貨市場更多的是參與者對未來期貨價格的判斷,所以未來的供需情況才是最關鍵的因素,而大數據的核心就是預測。黃勁文表示,如今,生產、經營、快消物流、運輸中已經實現了信息化管理,大數據也可以從海量實時更新的數據和各方數據之間,提煉出即時數據和先導數據。
“從前在使用統計模型計算時,傳統的數據計算方式受制于成本、運算處理能力,計算時選取的因子比較少,每個因子用的樣本量也有限,導致樣本量對整體數據的代表性不充分。而且各個因子之間的相關性可能無法從數據計算中體現,所以結果誤差會比較大。”黃勁文告訴期貨日報記者。
黃勁文表示,如果增加樣本量,成本就會呈幾何倍數增長。但是隨著計算機技術飛速的發展,我們不僅可以收集到海量數據,還可以使納入計算的因子數量從幾個增長到十幾個,甚至幾百個。更重要的是,這些因子彼此之間的關聯變化也可以納入考慮。所以,傳統的因果關系分析已經不再是重點,通過多因子之間關聯變化,進行多方位的判斷才是大數據時代的關鍵所在。
黃勁文舉例說:“利用大數據預測雞蛋期貨價格時,在供給方面,投資者要關注蛋雞存欄、雞齡結構、母雞死淘率等,這些反映未來一段時間雞蛋供給的因素。在需求方面,原來只看雞蛋的需求情況,現在我們不僅要考慮雞蛋價格與肉雞、豬肉和蔬菜價格的關聯性,對相關產品的需求進行綜合判斷,還要看樓盤開工率、大型基建項目可能形成對未來肉類食品的需求。”
事實上,在大宗商品市場中,大數據能更及時、更準確地預判未來的供需關系,對未來價格的判斷也會更準確。這將為交易機構、現貨貿易商、生產方、消費方的經營和決策提供很大幫助。另外,從交易角度來看,超前信息和準確預測就意味著勝算更高,尤其是基于基本面交易的私募等機構,相關品種的超前數據對他們尤為重要。
但是,目前我國除了貴金屬、有色金屬等工業品的數據比較成熟外,專業提供農產品數據的機構者相當匱乏,很多農林牧漁產品相關數據服務幾乎還是一片空白。雖然我國會發布一些統計數據,但是對大宗商品市場的參與者來說,時隔兩三個月甚至半年的數據對他們提供不了什么幫助。以至于有些風險管理公司、保險公司等在為客戶服務時,甚至陷入與客戶對賭的境地。可以說,農業產業的大數據尚未應用到大宗商品市場對供需情況的判斷中去。這點對大宗商品市場來說,是落后于當今信息化時代的。
黃勁文建議,如果數據服務商從金融的角度切入,對產業鏈數據進行整合并形成體系,填補這部分市場空白,行業主體就有機會對市場整體情況作出更準確判斷。那些服務現貨市場的衍生品提供者就可以根據大數據量化而得到信息,從而設計針對客戶需求的個性化產品,同時服務成本也會得到有效壓縮。這對產品提供方而言,產品更具競爭力,而產品提供者和使用者之間也不再是“零和游戲”,整個行業的發展方向也會因此而發生改變。
D 大數據在新興市場的生發速度更快
大數據的應用過程,首先是數據采集,其次是數據的處理、加工、挖掘過程,最后是把這些數據量化、信息化,變成是一個支持決策和風險管理的工具或投資策略。黃勁文分析說:“采集的角度一定要科學。美國農業部對整個農業環節的數據采集既多又精準,不受主觀因素的影響。而我國很多行業在這方面還有較大的距離。”
此外,除了數據的處理、挖掘可以用一些技術手段實現外,黃勁文告訴期貨日報記者:“還可以利用數據決策的工具,如商業智能(BI)等在國外也被迅速推廣,國外的交易所利用BI進行流動性管理已經相當成熟,但目前我國在這方面的應用還比較少。”
“目前從全球大宗商品市場來看,各國對大數據的應用并沒有太大的差距。雖然中國等新興市場國家大數據的發展還存在很多問題,但作為后起之秀,今后的發展潛力會更大。畢竟技術的發展本身就具有跳躍性。”黃勁文坦言,雖然大數據時代初期,國外因較早地開發了大數據思維和信息技術設備,而具備一定的優勢,但這種優勢并不能長久地維持下去。在之后的發展中,他們也會被其他國家和地區所超越。
黃勁文接著說道:“很多人可能不知道,現在美國移動電話的普及率還不及中國,美國很多地區還是使用固定電話。這是因為先前固定電話的普及率高,一些地區用戶已經形成了習慣,使得移動電話的市場很難被打開。這雖然聽起來不可思議,但卻是事實。大數據的應用也是一樣。”
黃勁文認為,國外長久以來傳統的數據收集和統計方式也非朝夕就能改變。而且考慮到數據的延續性和可比較性,有變化就要面對有變數的風險,所以已經形成的權威方式就很難輕易被改變。比如美國農業部統計數據,使用的還是十幾年前的統計方式,只要現在統計方式還是有效的,國家就認為沒有必要去改變。相比之下,在新興國家和地區,大數據思維的推廣沒有歷史的包袱和限制,成長空間反而更為廣闊,生發速度也會更快。
除此之外,更重要的一點是,即便現如今中國在數據收集、分析等設備方面的技術不一定能站到世界領先之列,但是影響世界金融市場形勢的各種數據卻大多源于中國。未來,我們可以利用大數據做更多的事情,對數據本身的掌握程度將會轉化為經濟價值的來源。
正如Viktor Mayer—Schonberger(維克托·邁爾—舍恩伯格)與Kenneth Cukier(肯尼斯·庫克耶)合著的《大數據時代》一書中所說:“大數據時代的早期,思維和技術是最有價值的,但是最終大部分的價值還是必須從數據本身來挖掘。”近年來,國內已經有越來越多的投資者注意到大數據的潛在價值,擁有大數據或者能夠輕松收集大數據的公司,股價受到投資者的追捧。
與此同時,國內大數據開發相關的互聯網題材也成為了風投的新寵。“大數據作為金融衍生品的朝陽產業之一,無疑有巨大的發展潛力,尤其是在中國。”黃勁文信心滿滿地告訴記者,中國的期貨市場發展時間短,品種也只有50多個,相比于歐美市場還不夠成熟,但這也意味著中國比歐美市場有更廣闊的發展空間。
期權誕生在美國,早在20世紀70年代美國就開始了期權交易,而中國的商品期權現在還在仿真交易階段。另外,在美國,金融期貨占期貨交易量的80%,而中國目前僅有幾個金融期貨品種。黃勁文認為,中國金融衍生品發展還有非常多的機會。而且對金融衍生品來說,其發展并不受現貨產量的限制。“比如雞蛋期貨至今上市1年多了,它的名義交易金額可以達到現貨年產值的10倍甚至更多,再過10年,這個市場容量也許要翻30倍之多。”黃勁文說,中國金融衍生品仍有很多的發展機會。