大數據企業近期在境外資本市場有越來越備受關注的趨勢。本文對有關情況作出詳細的介紹。
背景
2014年可稱為大數據于國際資本市場開始騰飛的年份。不論在公司數量、總市值、銷售、利潤、并購頻繁度、及主流媒體關注度均呈現爆炸性之質與量的增長。其中大數據龍頭企業,2012年在美國本土IPO的軟件公司Splunk的市值于2014年首次超過126億美元。另外一家于2013年IPO的美國軟件公司Tableau,承過去兩年每年超過90%之銷售增長及103%之利潤增長之勢,市值已傲然挑戰70億美元。
與此同時,眾多國際明星企業亦以行動證明它們對大數據的重視。蘋果、IBM、微軟、沃爾瑪、英特爾、谷歌、亞馬遜、甲骨文、思科、SAP、迪斯尼、VISA、花旗銀行、eBay、雅虎、臉書、推特等均相繼開始并購及投資于為數眾多的大數據相關的創業企業。究竟大數據的魅力來自何方?
「大數據」概念的產生及歷史沿革
要了解大數據如何成為國際資本市場的寵兒,必須先知道大數據概念的演進。1986年,全世界所有的數據存儲總量為3 Exabytes/EB(= 3,000,000TB = 3,000,000,000GB),而其中只有1%以數碼形式存在,余下的99%均以模擬形式存在。簡單一點來說,一部全新基礎型號的iPhone 6有16GB的內存,大概可以存儲3,500首歌曲。10TB(=625臺iPhone)的計算器硬盤便足夠容納美國最大的國會圖書館里面所有書本及印刷品所載數據。3EB約等于300,000個美國國會圖書館的書本及印刷品總量。可以說,在1986年當時人類所擁有的資料和信息量已經是相當驚人的。
到了互聯網開始普及化的1993至2000年期間,全世界所有的數據存儲量從1993年的16EB迅速猛增至2000年的54EB,其中數碼資料占比重更從1993年的3%飛躍到2000年的25%。至2007年,全球資料存儲總量達到了295EB,而其中超過94%為數碼資料。更令人驚嘆的是,在之后短短5年,即到2012年,全世界資料量膨脹至2,750EB,并預計于2015年將會達到8,000EB,而其中99%將為數碼資料。短短的20年間,數據總量增加了超過500倍。
如此巨大變化的源頭可以追溯到1977年第一臺在銷售上獲得普遍性成功的微電腦蘋果Apple II。其后IBM于1981年推出成為業界標準的IBM PC微電腦。計算機的普及化,同時帶動了計算機軟件、通訊標準、零件配件各產業的高速增長,成就了蘋果、IBM、微軟、甲骨文、英特爾等到現在還迄立不倒的資本市場巨人的奇跡。隨后計算機的計算能力大致維持每18個月增加一倍(所謂的『摩爾定律』)的持續增長。同樣有關的是摩托羅拉于1983年推出第一臺普及的流動電話。這一階段可以稱為大數據的奠基期。
第二階段的標志年份為1994年。那一年,網景(Netscape)推出互聯網瀏覽器,令『上網』不再是一個艱難和難以明白的活動。此后風起云涌、豪杰此起彼落。巧合地,上述的第一階段和第二階段正是美國資本市場有史以來歷時最長、增長最大的大牛市。后來,2000年的科網熱潮推動了無數資信科技企業的騰飛,谷歌、亞馬遜、思科等舉世矚目的企業均于此時成就大業。計算機與互聯網成為了人們生活與工作中不可或缺的工具。
第三階段的推動力來自多方面。搜索引擎的圓滿成熟,社交網絡的燎原之勢,視頻網站的高速成長,創新產品和相關應用—特別是智能手機的橫空出世,徹底改變了人們對科技產品的態度,也創造了與以前截然不同的生活習慣及態度。單在2014年一年里估計有62億臺全新制造,具有上網能力的智慧手機、平板計算機、計算機和其他智能電器投入市場。全球互聯網用家也從2000年總人口的21%升至2014年的39%(28億人)。
另一方面,隨著科技普及化市場化帶動的規模經濟,令所有相關零件產品面對前所未有速度的降價、提速、升級。20年前,一個精確性遠遠不如現今的GPS組件,價格卻是現在的200-300倍。現在的上網速度是10年前的10倍,但成本卻便宜10倍。30年前5GB的硬盤需要5,000,000美元,今天每5GB只需要5美元, 價格便宜一千萬倍。15年前數碼照相機的感光組件成本是現在的100倍,但像素比現在差8倍。功能的提升配合成本的下降,容許產品安裝各類收發器與傳感器;收發器傳感器的無處不在,容許產品記錄顧客、供貨商、員工、貨品等等的各種狀態和位置;存儲容量的上升與成本的急速下降,容許企業存儲并處理以前不能想象的數據。
在此過程中,大數據相關項目悄悄的誕生。大數據既是果,也是因。用戶不斷渴求和使用天量的數據:搜索、文件、網頁、音樂、視頻、娛樂、和林林總總通過新媒體的社交體驗。在用戶利用數據時,他們也同時產生天量的使用數據:搜索歷史、瀏覽歷史、評論、自創內容、工作成果等等。相應的企業不斷推陳出新,開發以天量數據為基準的新產品新服務(例如:搜索結果、網購、視頻、網游),并千方百計研究如何利用過程中收集的天量顧客與營運數據,極力優化銷售資源、提高生產效率及降低供應鏈成本。
全球大數據基礎市場(直接提供大數據硬件、軟件、專業服務)預計2014年為300億美元,并以每年17%的速度增長。歐美國家預估,從大數據項目引發的額外GDP增長,于2020年會達到每年額外4,000億美元的龐大數目,其中貿易轉運占23%,制造業占22%,財經保險占13%,公共開支占13%,信息工業占6%,醫療服務占5%。
大數據的五個「V」
經過理論的完善配合實踐獲得的經驗,國際學術和企業界把大數據總結為五個『V』,筆者試稱之為『兩多三高』:
『多數量』(Volume)
『多種類』(Variety)
『高速度』(Velocity)
『高精確』(Veracity)
『高價值』(Value)
『多數量』(Volume)
『多數量』的涵義為:極大量的原始或已經處理過的數據。此不單是指企業數據庫絕對容量的爆發性增長,更泛指企業具有的收集、處理、分析與儲存極大量數據的能力。而其中大數據數據和傳統分析數據的重大差異為, 大數據數據包含總體及其所有數據,而傳統分析數據以取樣數據(總體之一部分)做出推論。亦是這個優勢令大數據分析擁有更完整更強大的預測能力。
『多種類』(Variety)
『多種類』的涵義為:多種格式、多種來源、而通常為結構不規范的數據。數據可能為文字,數據、語音、圖片、影片,可能來自散布全球的來源和數據庫,更可能的是各自擁有各自的數據結構。如何把這些數據聯系并統一規范是巨大的挑戰,但亦代表一旦發掘成功,會賦予企業一個前所未聞的商機機遇。
『高速度』(Velocity)
『高速度』的涵義為:實時數據,實時處理,實時分析,實時行動,實時演進。授予實時的分析能力,并容許不斷而快速改進數據庫和分析方案。不同范疇的數據,配合完整的、極精細的數據收集,令企業可以實時改進分析方案,并探測到之前傳統分析工具不可能解決的短期模式與微觀趨勢。高速度的挑戰性在于需要專用的高性能、超低延時的硬件、軟件與聯網配套。
『高精確』(Veracity)
『高精確』的涵義為兩重:數據來源必須為可信的、高質素及沒有犯系統性的謬誤。如能做到此基本要求,大數據框架可以解決傳統方法不能或不足以運作的分析或數據。隨著數據量之增加,分析會更精準。筆者在這里試舉瞎子摸象的故事。無論有多少個瞎子,如果引導他們去摸一頭河馬,最后他們也不可能推論出大象的外觀(喻示不可信的數據源)。如果讓3個瞎子去分別摸大象的鼻子、耳朵、腿,但不準他們互相溝通,他們對大象的外觀會有各異其趣的結論(喻示傳統分析方法的局限);如果讓1個瞎子任意無時限去摸象,經過一段時間后,他對大象的評述應該無限接近事實。這個就是大數據時代的核心理念。
『高價值』(Value)
『高價值』的涵義為:改善效率,降低成本,創新產品,增加企業與國家安全。大數據令企業更加明白自身的運作,強勢和弱點,并指引明確的方向,讓企業可以爭分奪秒改善供應鏈、制造、營運和銷售上的任何短板。也容許企業實時地、準確地抓緊稍瞬即逝的任何微小的、短暫的商機,推出更符合市場以至每個顧客特定需要的產品與服務。最重要的是,正確實行的大數據方案,保證企業牢牢掌握資金、資源、和顧客的宏觀流向,在每步均獨占先機,確保企業的生存和持續經營。
資本市場與大數據企業的化學作用
如上文所說,第二階段中的科網熱潮成就了無數的大型企業。究竟資本市場在當時扮演了什么樣的角色?回想當年,資本市場對當時“新概念”的科網公司給予了突破性的估值方式,不以收入、營利、資產等傳統的估值參數為重點。根據當時的“科網理論”,互聯網公司的價值取決于吸引客戶/用戶的速度,即使虧損也在所不計,他們買的壓根兒就是公司的未來。在巔峰時期,主要衡量科技公司股價的納斯達克指數曾經超越5000點的歷史高位。很多“純概念”公司,即使從來沒有賺過錢(甚至從來沒有收入)都能通過首次股票發行(IPO)于主要的交易市場掛牌并籌集巨額的資金。雖然不少公司最終在科網泡沫爆破時倒閉,但這狂熱投資的大時代仍造就了不少現在家傳戶曉的品牌。如亞馬遜,在科網年代時為了增大市場占有率,不惜以低于成本價銷售產品,導致連年錄得巨額虧損。但現在他的商業模式已獲得肯定,成為賺錢的公司,股價對比2001年的“谷底”翻了50多倍。谷歌更加從云云的搜索引擎公司脫穎而出,成為從多網民每天生活的一部分,身價也躍升成全球市值最大的公司之一。 這些企業的成功也帶動其商業模式的“國際化”。百度、攜程、優酷等很多著名國內企業都是以先優化(ENHANCE)及地方化(LOCALIZE)這些商業模式,再通過美國資本市場融資而最終獲得成功。
可以說,資本市場對科網概念的亢奮成了上述科網公司成功的主引擎。創投資金的泛濫,營造了特殊的環境,讓科網公司可以在長期沒有實質盈利的情況下成長,時勢創造了“英雄”。近年來,越來越多跡象顯示大數據行業將成為資本市場下一波的“寵兒“。隨著資本市場對大數據概念的肯定,創業投資基金以及私募基金不遺余力加大對大數據創業公司投入的力度。按非正式統計,2013年投入的資金已超過2008至2012年之總和。大部分的目標公司都是從事數據儲存,數據管理及數據分析的軟件/方案開發,其中之皎皎者為:
——估值已超過90億美元的Palantir,主力從事資料分析,已募集創投基金6億5千萬美元。
——估值達至少40億美元的Cloudera,從事HADOOP數據儲存及處理平臺的開發,已募集創投基金10億4千萬美元,投資者包括行業中有名的英特爾(Intel)及谷歌創投(Google Ventures)等明星團隊。
還有估值達70億美元的Mu Sigma,12億美元的MongoDB,及分別估值為10億美元的HortonWorks和New Relic,案例多不勝數,大部分(92%)都在美國(60%集中在加里福尼亞州)。數據顯示,這些公司提出的商業模式以及產品開發方向都非常類似,這意味著創投基金對這些商業模式的肯定。加上上面提到過大數據應用的持續普及,和之前科網熱潮的百花齊放,以寬松的估值方式“寧可投錯,不可放過”的局面很有可能會再次出現。目前中國的資信科技行業,從事大資料技術開發的公司并不太多,從業者如能好好把握未來的發展與機會,說不定就能成為下一波的“英雄”。
另外,最近發數據的行業應用也開始火熱起來。最近在深圳前海開始營業的“微眾銀行”的大數據金融概念深得國家支持,符合“普惠銀行”的政策。相信以后會有更多的行業跟大數據扯上關系,走向資本市場。
結語
隨著境外大數據企業近年在美國資本市場的落地開花,相信會為國內的信息產業帶來新的靈感及發展方向。作為世界上其中一個數據使用量最大的國家,我們期待的是國內大數據企業在未來資本市場的大爆發。
作者簡介
馬加瑋,畢業于美國加利福尼亞大學伯克利分校計算機及電子工程系及南加州大學工商管理碩士。回流香港后任職著名創投基金分析員,專門投資互聯網及電子商貿類企業。及后任職企業財務顧問,有15年資本市場經驗,曾協助多家大中華區不同行業企業成功在香港及海外上市融資。
羅干淇,畢業于香港大學法律系,香港特別行政區高等法院律師。有十五年國際資本市場經驗,曾協助超過十家民營企業成功在境外上市及融資,并曾擔任境外上市公司董事、董秘、法務總監、上市組組長及境外基金副總裁等職。