近些年,大數(shù)據(jù)的概念越來(lái)越多的出現(xiàn)在人們的視野中,各種通過(guò)大數(shù)據(jù)技術(shù)實(shí)現(xiàn)的應(yīng)用讓大家對(duì)他更加的期待,希望從大數(shù)據(jù)本身,挖掘更多的可能,讓未來(lái)的產(chǎn)品與服務(wù)更加精準(zhǔn)。根據(jù)維基百科的定義,大數(shù)據(jù)是指無(wú)法在可承受的時(shí)間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理和處理的數(shù)據(jù)集合。而大數(shù)據(jù)技術(shù)的戰(zhàn)略意義不在于掌握龐大的數(shù)據(jù)信息,而在于對(duì)這些含有意義的數(shù)據(jù)進(jìn)行有效的處理實(shí)現(xiàn)更有價(jià)值的應(yīng)用。換言之,如果把大數(shù)據(jù)比作一種產(chǎn)品,那么這個(gè)產(chǎn)品實(shí)現(xiàn)其價(jià)值的關(guān)鍵,就在于掌握并提高對(duì)數(shù)據(jù)的“加工能力”,從而實(shí)現(xiàn)數(shù)據(jù)的“增值”。
正是基于大數(shù)據(jù)在未來(lái)應(yīng)用的重要性,百度與西安交通大學(xué)在2015年的5月正式啟動(dòng)了旨在挖掘大數(shù)據(jù)領(lǐng)域優(yōu)秀人才的大數(shù)據(jù)競(jìng)賽項(xiàng)目,時(shí)至今日比賽圓滿落幕,7組選手從近900名參賽者中脫穎而出,摘得了本屆競(jìng)賽前三名的桂冠,展示了各自作為大數(shù)據(jù)領(lǐng)域人才的不俗實(shí)力。
作為本次大數(shù)據(jù)競(jìng)賽的主辦方之一,百度為此提供了十億人物關(guān)系數(shù)據(jù)集供選手們挖掘,針對(duì)任意給定的娛樂(lè)明星作為實(shí)體參照,構(gòu)建該實(shí)體的關(guān)系網(wǎng)絡(luò)。簡(jiǎn)言之就是通過(guò)提供的海量數(shù)據(jù)精準(zhǔn)有效的挖掘明星之間的關(guān)系。
要知道這十億的數(shù)據(jù)到底有多大。據(jù)負(fù)責(zé)本屆大數(shù)據(jù)競(jìng)賽組織活動(dòng)的百度校園相關(guān)負(fù)責(zé)人表示,其實(shí)用一個(gè)簡(jiǎn)單的例子可以讓大家更好理解這個(gè)數(shù)字到底有多大。如果把人們每天讀取與獲得的文字信息按照A4紙的篇幅來(lái)計(jì)算,那么一個(gè)人平均每天從各類渠道中所總共獲得大概20頁(yè)相當(dāng)于總共20000字的文字信息量,而本次百度與西交大的大數(shù)據(jù)競(jìng)賽所提供的十億數(shù)據(jù)條目則相當(dāng)于一個(gè)人約2596年所獲取的所有文字信息數(shù)量。
百度大數(shù)據(jù)競(jìng)賽評(píng)委之一同時(shí)也是百度BDL大數(shù)據(jù)實(shí)驗(yàn)室資深研發(fā)工程師的牛正雨表示,百度之所以為這次競(jìng)賽提供了如此量級(jí)的大數(shù)據(jù),正是希望能夠給非盈利或商業(yè)目的開放研究領(lǐng)域大數(shù)據(jù)研究者們提供真正的幫助,希望利用它們共同促進(jìn)大數(shù)據(jù)技術(shù)的發(fā)展。
大數(shù)據(jù)將改變?nèi)藗兊纳睢N磥?lái),在娛樂(lè)、服務(wù)、醫(yī)療、教育、交通、電子商務(wù)、金融、安全等方面都將會(huì)利用到海量數(shù)據(jù),從而提高人們生活的質(zhì)量,在天量級(jí)的數(shù)據(jù)中展現(xiàn)更多的可能。另一方面,大數(shù)據(jù)領(lǐng)域的從業(yè)者將是未來(lái)炙手可熱的稀缺人才,百度與西交大打造的大數(shù)據(jù)競(jìng)賽無(wú)疑為該領(lǐng)域的未來(lái)提前做出了人才儲(chǔ)備,借助百度校園這個(gè)橋梁,百度將持續(xù)與像西安交大這樣在技術(shù)上有著鮮明特點(diǎn)的頂級(jí)高校合作,打造極具影響力的互聯(lián)網(wǎng)創(chuàng)新人才培養(yǎng)平臺(tái)。