記者從香港中文大學(xué)深圳研究院日前主辦的“富媒體大數(shù)據(jù):感知、處理、檢索及應(yīng)用”博文論壇(第二期)了解到,如何對富媒體大數(shù)據(jù)進(jìn)行有效挖掘成為大數(shù)據(jù)領(lǐng)域的研究熱點,對數(shù)據(jù)進(jìn)行精確建模、設(shè)計高效算法、構(gòu)建核心技術(shù),從而實現(xiàn)數(shù)據(jù)驅(qū)動運營,是目前產(chǎn)業(yè)界和學(xué)術(shù)界正在探索和研究的主要方向之一。
“21世紀(jì)的‘數(shù)據(jù)’相當(dāng)于20世紀(jì)的‘石油’。”據(jù)香港中文大學(xué)計算機(jī)科學(xué)與工程學(xué)系教授、國際電機(jī)及電子工程師學(xué)會院士呂榮聰介紹,不同于傳統(tǒng)的多媒體數(shù)據(jù),富媒體大數(shù)據(jù)因聚合了多種媒體數(shù)據(jù)的動態(tài)性與交互性,包含了更多的信息與價值。大數(shù)據(jù)具有四個非常典型的特點4V,即規(guī)模急劇膨脹(Volume)、來源多種多樣(Variety)、變化快速瞬息(Velocity)、關(guān)系錯綜復(fù)雜(Veracity)。
今年7月,香港中文大學(xué)深圳研究院的深圳富媒體大數(shù)據(jù)分析與應(yīng)用重點實驗室項目獲批。該實驗室以富媒體大數(shù)據(jù)計算平臺為基礎(chǔ),以智能計算技術(shù)為核心,結(jié)合互聯(lián)網(wǎng)及多媒體相關(guān)應(yīng)用發(fā)展關(guān)鍵技術(shù),已積累了大量豐富的研究成果,并成功用于互聯(lián)網(wǎng)和教育等產(chǎn)業(yè)。
香港中文大學(xué)計算機(jī)科學(xué)與工程學(xué)系教授、深圳富媒體大數(shù)據(jù)分析與應(yīng)用重點實驗室主任金國慶告訴記者,比如通過社交網(wǎng)絡(luò)的分析可以進(jìn)行意見挖掘、感情分析,可以用分析工具獲知哪些人在推廣某些產(chǎn)品上更加有效,可以通過對企業(yè)負(fù)責(zé)人公開的社交網(wǎng)絡(luò)信息挖掘出一定的社會關(guān)系鏈,比如通過對文本相似度的分析,可以快速找出有抄襲嫌疑的文章,最終由人來決定一篇文章是否抄襲。
金國慶表示,目前這一檢測文件相似度的系統(tǒng)及方法已在香港、臺灣、新加坡等地申請了5項專利,已經(jīng)在香港政府與香港高校等較為廣泛的范圍內(nèi)使用,希望通過深圳的平臺做更多的推廣,推動該產(chǎn)品在內(nèi)地更大范圍內(nèi)使用。
據(jù)介紹,深圳市富媒體大數(shù)據(jù)分析與應(yīng)用重點實驗室不僅將繼續(xù)在富媒體大數(shù)據(jù)方面產(chǎn)出理論成果、分析工具、產(chǎn)品應(yīng)用等,而且將依托深圳這一產(chǎn)業(yè)型取向的城市在大數(shù)據(jù)產(chǎn)業(yè)化方面的優(yōu)勢,將更多研究成果向內(nèi)地推廣應(yīng)用。