互聯網行業以攪局者自居,邊緣崛起的大有人在。無論是最近的滴滴、快的對出租車行業的攪局,還是之前p2p、第三方支付對銀行業的攪局,傳統行業面臨著“轉型是找死,不轉型是等死”的窘境。
新崛起的互聯網企業戰勝傳統行業所用的武器是“臺階式”提升的,就像火器和冷兵器之間的對戰。人們普遍所理解的互聯網是將線下的世界搬到線上,這是只知其一不知其二。目前,科技的發展以指數級的速度不斷迭代,被資本市場冠以高估值的阿里不是因為它的電商業務,而是多年來積累的個人消費數據、征信體系和大金融概念。傳統行業至死也不曾獲得的秘密武器——大數據。
大數據是基于跨行業、跨地域、跨時間甚至跨形式的發生關系,從而產生價值,運用于垂直細分領域,如產品營銷、市場預測、風險管理。在運用過程中分為三個階段。第一,對現狀進行分析和感知;第二,對未來趨勢進行預測和判斷;第三,利用預測產生行為。在多次預測后,預測本身和預測結果形成新一輪判斷的依據,所謂前事不忘后事之師。能把這些數據直接利用得最好的則是金融業,現在我們稱為互聯網金融。
比如在經濟環境中,哪種政策手段能幫助國家機器走出中產階級陷阱,轉型升級中需要哪些財政政策的支持。調控從來不以股市為導向,但股市卻以政策為準繩,結果是即使保密再好的降息降準依舊逃不出綜合數據的支撐。
金融行業的數據形式分為結構化數據和非結構化數據,將兩種形式的數據結合起來是數據挖掘的難點。首先要解決大規模網絡模式數據的精簡表達和度量,追求捕捉的數據具有代表性和可讀性。其次是數據聚集變化,跨空間的數據在源頭進行交互,捕捉它的規則和規律,帶來多數據模式的判定。最后才是自我迭代,根據運算對以往信息的度量、數據源頭的匹配和計算模型的設計進一步優化。
解決這些難點在于數據的開放。交易家Mi-Trader在研究時發現,數據產生的源頭往往不能利用好這些數據,企業經過分析后的數據可以幫助企業決策,而利用大量第三方數據匯總后再計算得出的真正有價值的數據。最后,將這三種維度的數據組合才呈現出準確的預測。
在股票交易中,股票交易節點強度和頻度是隨機的,中國90%以上投資者是中小投資者,操作中帶有情緒化,通過第一手的交易數據、第二手的盈虧情緒和第三手的投資者畫像總結規律,沉淀出海量的規律后就可以對未來做出初步預判。另外,中國資本市場充斥著坐莊的跡象,作為監管部門都難有真憑實據遏制操縱的發生。可是,操縱股價背后的邏輯是被操縱的股票,交易量和交易頻度之間產生非線性關系,要預測其走勢必須通過自我學習方式改變初始算法。
這是一場叫信息世界、物理世界、信息空間的復合運算。作為預測領域的最前沿,Mi-Trader提出“沒有數據也是一種數據”。結合交易空窗期、輿論空白點在市場情緒及經濟導向中尋找關聯,我們拭目以待。