臺北資訊工業策進會前瞻科技研究所所長林蔚君博士指出,大數據的特性可歸類成4V,即Volume(數量)、Velocity(速度)、Variety(多元種類)和Veracity(準確度)。
她說,大數據是量很大的資訊,來的速度十分快,我們還可因為它來的速度快慢,來決定事情的嚴重性。
如煉油萃取精華
她表示,大數據的資訊多元化,重要的是有些資訊是有不準確度,因為資訊是傳輸過來,還沒經過分析。
“社群網站上大家留言,我說的優秀跟你的優秀可能差別很大,更別說有些人是快速留言,你怎么去判斷它的準確性?”
林蔚君今日下午配合《南洋商報》金鷹獎百萬講堂第二場講座,上愛FM節目分享心得時,這么說,當我們進一步分析有關大數據資訊后,就如煉油般,最終萃取到里面的精華,找到它的價值。
IoT功能比云端多
林蔚君表示,2011年是大數據的原年,在這10年來軟體和服務進步迅速,很多業界開始利用云端處理資訊,在這5年里面還盛行移動通訊及三星物聯網(INTERNET OF THINGS,簡稱IoT)。
她指,這些大數據資訊不再是傳統公司所有的固定文字和數字類別,現在上網后,還有優管和影視資訊,因云端能讓人們上載許多資訊。
“云端可以跟著人走,無所不在,而且傳達持續性訊息,一直跟新資訊。”
分析社交網商機無限
林蔚君說,有了IoT后,它的功能比云端還多,人們可以多重劃分,倘若家里是實施綠色建筑的話,就有更多保衛安全的無線監控系統。
她指出,網絡上充斥許多社交媒體網絡,如面子書和推特,人們都會把自己的“心情”
和資訊放上去與朋友分享,若能分析有關資訊,豈不更商機無窮嗎?
她說,這些科技與人的互動,包括云端、移動通訊、三星物聯網及搜索網站整合下,自然就產生大量數據。
善用內外資訊 助企業作決策
林蔚君表示,大數據給予企業新機會,企業除了要善用公司內部資訊,也要收集外部如社交媒體的資訊,來幫助公司作決策。
她指出,以往公司要收集客戶對新產品的反映都要經過長時間調查,如今只要上到社交媒體網站,如面子書就能看到客戶對新產品或服務褒貶的評語。
“當你產品有問題的時候,你需要馬上去處理,把傷害減低。”
她說,大數據可拿到內部和外部資訊,公司可以獲取客戶的反應,對整個公司運作幫忙很大,有不好的地方就可以馬上改進。
對于一些小公司聲稱沒有數據,她說,有關公司雖然沒有數據,但有關公司周圍充斥許多數據,不僅各社群網站,還可以收集“公開數據”(Open Data)。
“如果客戶是你的會員,你有客戶消費資料,了解客戶的消費心態在哪,你就可以提供他個人服務,你還可能比客戶本身還了解對方。”
她舉例,美國航空、淘寶和阿里巴巴網站都采用大數據分析,給予客戶個人化服務。
蕭暉議:各有技術 大數據收集應用5階段
臺北資訊工業策進會數據科技與應用研究所副所長蕭暉議博士解說,從收集到應用大數據分成五大階段,即收集、存檔、整理、分析和結合訊息。
他說,在5個階段里,每個都有它的技術,在收集到外部社群網站數據、公開數據和企業內部數據后,拿到后要進行清洗過程及資料抽取。
可改善產品
“以前企業資料都是結構化,較容易分析,但在社群數據或公開數據需要抽取你認為重要的訊息。抽出來后就要整合、歸類,變成有結構的資料后,才可以很容易進行分析。”
蕭暉議舉例,一半人多會上網找酒店和餐廳的評價,這些評語經過大量收集分析后,對你生活有幫助,對公司而言,可改善產品。
為金鷹獎百萬講堂主講
在第二場“金鷹百萬講堂”開講之前,林蔚君和蕭暉議應邀上愛FM與聽眾分享心得,金鷹獎籌委會主席兼《南洋商報》業務發展經理沈小珍亦參與訪談,電臺主播是蘇進川和謝勁程。
金鷹百萬講堂全國巡回講座將于本周三(7月1日)來到檳城喬治市Jen Penang酒店,下午2時,臺北資訊工業策進會前瞻科技研究所所長林蔚君博士將會主講題為“大數據:智慧世界來臨”的講題。
此外,林蔚君建議沒有大數據的公司,需要開始有數據策略,首先第一步就是先從公司內部、客戶和伙伴的數據開始收集。
她說,對大數據不了解的公司,可以請顧問咨詢。
“現在我們活在數據經濟的時代,光是科技資訊是不夠的,要科技資訊加上數據,更重要的是數據分析,再將之應用出來。”
然后,她認為,公司要選一個具體領域作為大數據的收集范圍,從小做起,尋找相關的資訊。
“你要做的如人飲水,冷暖自知,你可以介紹請很多人幫你,但最終的你公司自己要培養自己的人才。”