二次大戰時,德國納粹軍隊所使用的「ENIGMA密碼機」(音譯:恩尼格瑪密碼機),可以將普通的訊息,加密成亂碼,隨著轉輪與接線的設定和組合,變化出159京(1016)種密碼,利用無線電報的方式,把密碼傳給遠端的伙伴,由接收的一方,用相同的系統解密,還原訊息。
ENIGMA密碼機的資訊量龐大,敵軍如果沒有解密系統,即便是最出色的數學家,也必須攔截大量電報,經過數星期的研究后,才能解開一個密碼;然而,ENIGMA密碼機只要稍微調節轉輪和接線,瞬間就可產生無數組不同的密碼。
經過長時間的研究解密,英國的數學家艾倫?圖靈(Alan Mathison Turing)結合了統計方法,與長期從情報單位所累積的資料,終于破解了德軍的ENIGMA密碼機,解密的時間從數周,大幅減短成一個小時之內,盟軍也藉著破解德國密碼通訊,扭轉了大西洋戰場的戰局,成為二次大戰的一個重要轉捩點。
3V組合而成的大數據
這幾年,人人都在討論大數據(Big Data、Megadata,或稱巨量資料、海量資料、大資料),根據義大利研究顧問公司META Group(現在改稱Gartner),分析員Doug Laney在2001年的研究報告中得知,大數據包含「量」(Volume,資料大小)、「速」(Velocity,資料輸入輸出的速度)與「多變」(Variety,多樣性),合稱「3V」或「3Vs」,有些企業更在3V之外,新增了真實性(Veracity)和價值(Value)兩個V。
大數據近似于在二次大戰難以破解的ENIGMA密碼機,都擁有龐大的資訊量,并能在短時間之內,快速解構數據;不同的是,大數據包含許多非結構性(見動腦小字典)的數據。
IBM華生實驗室經理張書平博士表示,員工本身交流的訊息、客戶合作的建議、使用者對產品的看法等,都屬于非結構性數據。
早期的技術,無法儲存、分析龐大的數據,所以有很多珍貴的資料都被丟掉了;但現在分析技術進步了、所需的成本也降低了,這樣的情況下,就看企業要不要處理數據、處理的目的為何,以及該如何處理,這些是企業主使用大數據分析前,需要積極思考的事。
民眾走過的痕跡都是不容忽視的線索
根據全球27個行銷聯盟組成的GlobalDMA,和美國市調顧問公司Winterberry Group,在2015年3月訪問了全球17個國家,約3000名廣告人員,所做的行銷人員使用大數據調查現況報告指出,行銷人員最常獲得大數據的來源,第一名是網站(66%),接下來依序是,智慧型手機App(58%)、電訪(51%)、社群網站(49%)。
星傳大中華區數據分析事業總監Kishore Parthasarathy指出,隨著科技日漸進步,媒體從傳統的電視、報紙、雜誌和廣播,演變成各式各樣的數位媒體,品牌經營者可以從 Facebook、Twitter、WeChat等社群平臺,或是民眾所使用的智慧型手機、平板、電腦等媒體載具,收集大量且變化快速的資料。
透過從不同數位媒體收集而來的數據,企業主更能清楚掌握民眾的生活脈動,和媒體使用行為,像是民眾關心什么議題、在什么時候什么地點、使用什么載體瀏覽與品牌相關的訊息,藉以規畫出更切合民眾生活習慣的活動,并進一步分析數據,用客觀的數字來判斷,在各個不同媒體上應該投放多少的預算。
Parthasarathy強調,每一筆資料都不容忽視,因為多樣化的數據,可以慢慢拼湊出消費者的輪廓。而當企業運用大數據時,不僅應該讓熟悉大數據的專業人員,來管理和分析各式數據資料,更需要與不同領域的策略伙伴,建立起資料合作關係(data partnership),并與時俱進地利用新科技與新工具,才能從數據中找出更多的機會。
讓數字說話找出問題的解答
甲骨文亞太區企業架構師王任遠認為,大數據最大的挑戰在于,如何統整、儲存和分析結構性和非結構性數據,并讓數據跟傳統的統計學相輔相成,用新的方法和思維,去分析、應用,找出數據的價值。
舉例來說,第34屆美國盃帆船競賽(America's Cup),Oracle Team USA就運用從海面上的訊息,像是風速、風向、海面氣象等,結合帆船本身收集來各種參數,每天產生近200GB的數據。
透過WIFI傳送大量的數據到分析器Oracle Exadata,即使Oracle Team USA的數據分析團隊不在比賽現場,都能知道Oracle Team USA當天的表現,哪些地方需要修正和調整。
Oracle Team USA的數據分析團隊表示,Oracle Exadata縮短了數據生成及調查的時間。如此一來,各部門就能獲得即時數據,并在開會前,先針對自己的部門修正問題。也因此,Oracle Team USA能在短短一天內,就有明顯的進步,最后成功打敗對手,衛冕冠軍寶座。
王任遠表示,企業應該要專注在數據資本(data capital)上,看數據能為企業帶來什么價值,而價值也會因為產業、部門人員切入的角度不同,產生不同的價值。大數據不是只有企業的科技人員需要了解,行銷、業務、財務人員都需要一同學習,因為大數據能夠協助做出客觀、聰明的決策。
王任遠提醒,操作大數據前,企業不該假設如何解答問題,而是要讓資料說話,透過跟資料互動,找出商業模式,之后再用簡單的統計模型,檢測用大數據得出的商業模式是否有效。
有了大數據精準找出民眾需求
大數據除了能夠應用在比賽中,更可以藉由累積和分析眾多的歷史數據,觀察民眾的喜好、習慣,推薦他們可能需要的商品,Amazon網站近期推出的服務「Amazon Machine Learning」,就是一個很好的例子。
Amazon Machine Learning是以云端運算為基礎的服務,協助合作廠商從龐雜的資料中,摘錄出對企業最重要的資訊。當網友登入Amazon的網站后,Amazon Machine Learning可以根據網友的購物紀錄,從成千上萬筆的產品資訊中,找出網友可能會購買的產品,并讓他們在30分鐘以內下單。
有了Amazon Machine Learning后,合作廠商和產品研發商可以透過分析數據,優化商品的服務或是消費體驗,創造品牌忠誠度,也吸引顧客再次上門。
雖然云端運算服務能夠提供企業主更多有用、精準的數據,但IBM華生實驗室經理張書平指出,臺灣的云端運算服務,因為牽涉到資訊安全,許多廠商不愿意把資料提供給第叁方公司處理,這也導致臺灣云端運算技術,雖然討論聲量很高,卻很少人因此從中獲利。
張書平預估,大數據的發展會愈來愈成熟,并深入到民眾的生活中,例如,透過大數據的收集、分析和應用,未來手機App可以客製化幫民眾做更多事,是生活小幫手,也能跟手機的主人聊天,「大數據」可能會成為歷史名詞,但實際應用會進入到各行各業。
從過去看見未來
大數據行銷最迷人的地方在于,從歷史資料中找出精準的消費者洞察,也因此近幾年來,大數據行銷的話題熱度持續延燒。
不過比較可惜的是,臺灣因為企業規模小、愿意投注在大數據分析的資本也較少,再加上政府對相關法律的規範,相較于其他國家來得嚴謹,所以臺灣在大數據行銷上,仍有許多的發展空間。
利用大數據 贏得美國杯帆船競賽冠軍
Oracle Team USA在美國盃帆船競賽中,每天觀察海面上的訊息,并結合帆船本身的資訊,產生龐大的數據,讓后勤的數據分析團隊,時時調整、修正不足的地方,靠著理性的分析,成功衛冕冠軍寶座。