臺灣精誠集團Etu項目負責人蔣居裕發言 (中國臺灣網 王怡然 攝)
2014年(第六屆)兩岸互聯網發展論壇今天在臺北舉行。臺灣精誠集團Etu項目負責人蔣居裕先生在論壇上分享了對互聯網時代大數據風潮的經驗和看法。
蔣居裕介紹說,不管在企業內部還是互聯網世界,都想要在大數據里面抓尋一些價值為自己所用。70%-80%的大數據先由做軟件的技術人員去編程序,把資料數據整理之后進行商業分析,呈現出視覺化的效果,最后再組成一個分工的團隊實現的數據的價值。
蔣居裕重點介紹了大數據背后一些重要的環節。他說,兩岸講大數據都會解釋其三個V(velocity、volume和variety),即速度、數量和種類。三者其實是相輔相成的:有了很大的數據量,數據要及時、實時的進來,就必須迅速處理分析。最近十年,由于云端技術,分布式運算以及軟件的存在,雖然數據量加倍了,用相同時間也能處理完。其中大部分軟件都是開源,其中一個非常重要的開源技術起源于谷歌,這使得今天互聯網企業以及一些金融、電信等傳統企業也在探索使用類似的技術。
他說,大數據的處理跟分析是兩個不同的能力,有先后關系。大數據有一定的實時性,要把各種的復雜格式處理變成干凈的數據集之后,才能提供進行資料分析。前面的處理要花去70%-80%的時間,雖然分析占的時間非常少,可是價值卻很高。分析洞見的討論多于行動,但要拿大數據里面的價值,一定要有行動。常見的行動是推薦,這個行動的運動率叫做轉化率或者是提高,這樣可以實際驗證成果。大數據的分析方法和傳統的統計分析相同。現在大數據有很多非結構化的數據,這些非結構化的資料要進行它結構化才有辦法具體分析。必須要有人工智能加上工人智能,才有辦法把大數據的價值轉化出來,而且轉化的比較好。
蔣居裕表示,面對這些大數據的風潮,涌現出的這些現象,我們該做什么?第一件事情就是鍛煉自己,能夠面對問題;第二件事是組織一支科學團隊,策略者、分析者、處理者是一個科學團隊不可或缺的三種角色。最后就是采取行動。我們的大數據還在早期,要進入到跨越一個鴻溝中間的過程,所以現在很多項目要重復使用大數據的解決方案,才能跨越鴻溝。