一、引言
自從人類社會進入信息時代后,數據作為信息時代獨一無二的傳遞媒介,在我們的生活中無處不在。特別是隨著互聯網和物聯網的快速發展,似乎一切都可以被數據化、被記錄。曾經靜靜躺在各種媒介中的數據,開始爆發出驚人的價值和巨大的信息量,這引起了越來越多人的關注和重視。人類已經邁入一個深度挖掘數據內在信息和核心價值的大數據時代。
在這場大數據的浪潮中,高校扮演著重要角色,既是大數據時代的參與者,也是大數據發展的推動者。高校能夠利用自己所掌握的大量數據和信息資源,在教育和研究工作中發揮出舉足輕重的作用,這也是順應大數據時代發展趨勢、推動自身信息化建設和發展的一個良好契機。
美國政府為了順應并推動大數據這一趨勢,于2012年3月宣布投資2億美元啟動“大數據研究和發展計劃”,把大數據研究和生產計劃提高到國家戰略層面。2014年4月,美國聯邦教育部宣布從財政預算中拿出2500萬美元用于教育數據挖掘和分析。我國也十分重視大數據在高校教育中的發展。《國家中長期教育改革和發展規劃綱要(2010-2020年)》明確提出,在加快教育信息化進程中要“加強優質教育資源開發與應用……促進優質教育資源普及共享”。《國民經濟和社會發展第十二個五年規劃綱要》提出,“重點研究……海量信息處理及知識挖掘的理論與方法……”
我國在高校研究大數據的條件更是得天獨厚。據國家統計局2014年2月公布的數據顯示,我國目前在校大學生達2468.1萬人。2013年我國網民近30%使用過在線教育產品,市場空間巨大。未來幾年中國在線教育市場將保持每年30%以上的增速。預計到2017年,我國在線教育市場規模將會突破1600億元。
然而在大數據風暴以迅雷不及掩耳之勢席卷全球各個行業的時候,我們卻充滿了疑惑,畢竟大數據本身尚未發展成熟,如何將它合理應用到高校領域還是值得深思的。本文將從高校中的大數據來源入手,分析高校大數據具有的特征,探討大數據將對高校信息資源共享發揮的作用,深入挖掘大數據在高校信息化建設應用中的挑戰,以探尋合理的策略實現大數據時代高校間資源共享,推動教育信息化的全面建設。
二、高校中的大數據
1.大數據是什么
(1)大數據的概念及目標
最早提出“大數據”時代到來的是全球知名資訊公司麥肯錫。麥肯錫[1]稱:“數據,已經滲透到當今每一個行業和業務職能領域,成為重要的生產因素。人們對于海量數據的挖掘和運用,預示著新一波的生產率增長和消費者盈余浪潮的到來。”Gartner[2]于2012年對大數據做出如下定義:“大數據是大量、高速及多變的信息資產,它需要新型的處理方式去促成更強的決策能力、洞察力與優化處理。”維基百科對大數據的定義則簡單明了:大數據是指利用常用軟件工具捕獲、管理和處理數據所耗時間超過可容忍時間的數據集。[3]
無論哪種定義實際都強調大數據的目標:①獲取知識與推測趨勢;②掌握個性化特征;③通過分析辨識真相。因此,大數據技術的戰略意義不在于掌握龐大的數據信息,而在于通過將各種數據集合并后的分析得出大量額外的有價值信息和數據關系,幫助指導人們優化自身的決策和行為方式。
(2)大數據與傳統數據的區別
信息的大爆炸不斷提醒著我們,未來將會因大數據技術而改變。與傳統數據相比,大數據之所以如此受人追捧,是因為其具有天然優勢。兩者最本質區別在于:①數據采集的來源不同。傳統的數據庫只是采集基本數據信息,使用數據自身含義,沒有利用數據的附加價值。而大數據來源于對傳統數據的提取和分析,更強調數據之間的關聯性,主要研究數據間的關系;②數據應用的方向不同。傳統的數據庫主要對數據進行存儲和查詢,以對過去產生的數據進行保存為核心。大數據對事物發展的預測為核心思想,通過對海量數據進行分析,得到未來發展趨勢或者推斷將來的可能性。
2.高校中的大數據
(1)高校中的數據源
高校是一個每時每刻都會產生大量數據的地方。自從我國推行教育信息化以來,這些數據大部分被記錄保存了下來。比如人事、教學、財務等部門的基本業務數據,網絡教學課件和視頻、網絡遠程教育教學資源的多媒體數據,學生教師上論壇、微博、微信等社交網絡產生的網絡行為數據,校園網內連接無線網絡而感知的位置數據等。
伴隨著高校教育信息化建設程度的不斷深入和加強,比以往更多的海量數據被積累保存,這對于高校來說,是一筆寶貴的財富。這些海量數據并不是單純的數據積累、記錄和保存,其潛在的價值將會對現代化高校建設產生積極重要的意義。例如,通過對“課堂、成績、就業”等方面數據的統籌分析,能夠在一定程度上對傳統教育領域的授課和學習模式的改革給予指導和建議,通過學生的圖書借閱歷史和選課信息綜合判斷學生的興趣愛好。在這個信息就是金錢的時代,大數據技術的應用將會在高校教育信息化中起到越來越重要的作用。如何充分利用數據價值,使其為學校管理、教學、服務等工作提供有益幫助,將是本文重點研究的內容。
(2)高校中大數據的特點
對于大數據關注,往往過分集中于“大”的特點,而忽略了處理大數據所必須面對的一個難題:未經處理的碎片數據是造成大數據價值密度低的直接原因。在高校內部圍繞著教師或學生服務和管理產生的數據也具有“碎片化”的特點。這一點王左利在他的論文中也提到了。[4]同時他還總結了大數據的另一個特點——持續性。“持續性”體現了校園科研、教學和管理業務的規律。必須基于長期、持續的數據進行統計分析,靠短期數據分析獲得的結論對指導教育教學改革無益。
而筆者認為,高校的數據還體現了另外一個特點——多維度。“多維度”能夠表征校園活動參與個體的完整狀態。如,對一位學生而言,學習成績反映學習效果;借書種類反映興趣愛好;一卡通消費情況反映家庭狀況;上網軌跡反映思想動態等。只有將多維度的數據進行有效整合,通過建立量化分析模型,反映一個學生的生活習慣與學習進步的相互關系,才能清晰全面地分析學生個體。
3.大數據教育與傳統教育相比的優勢
通過討論大數據與傳統數據的不同以及高校數據源的特點,發現在大數據影響下的教育與傳統教育相比具有諸多優勢,主要體現在以下三個方面:
數據采集:傳統教育數據的采集方式來源于調查問卷、心理測試等。采集標準和規則均已完善。而大數據的采集是過程式的,它關注著學生在校數據的整個生命周期,關注著學生在校生活的每一個微觀表現。
策略決策:傳統數據詮釋宏觀、整體的教育狀況,用于影響教育政策決策;大數據透析微觀、個體的學生在課堂上的狀況,用于調整教育行為進而實現個性化教育。
評估誤差:傳統數據來源于階段性的、針對性的評估,其采樣過程可能有系統誤差;大數據采用微觀持續性記錄方式,采樣的方式誤差較小。