一、大數據及教育大數據領域發展
2007年,圖靈獎獲得者、關系數據庫鼻祖Jim Gray發表了《第四范式:數據密集型科學發現》的演講,他憑借自己對人類科學發展特征的深刻洞察,指出世界科學的發展正進入數據密集型科研——科學史上的“第四范式”,即從經驗科學、理論科學、計算科學向數據密集型科學發展。
2008年9月,美國《自然》雜志發表了以“大數據”為主題的專刊,“大數據”這一概念受到高度重視,并迅速成為科學和創新領域的前沿話題。
2011年2月,美國《科學》雜志發表了關于大數據的專刊(Dealing with Data),發現如果沒有大數據科學家、云計算基礎設施、大數據分析技術的幫助,許多傳統科學領域的發展將一籌莫展。
2011年6月,麥肯錫研究院發布的《大數據:下一個創新、競爭和生產力的前沿》,對大數據的影響、應用領域和關鍵技術等都進行了詳細的分析。大數據就像遺傳性、顛覆性極強的基因一樣,推動著產業形態朝著“數據驅動范式”前進和變革。該報告中定義,“大數據是指其大小超出了常規數據庫工具獲取、儲存、管理和分析能力的數據集”。
這些代表性的報告促使了大數據時代序幕的拉開,人類社會正從IT(Information Technology)時代轉變到DT(Data Technology)時代,并催生了現代信息技術發展的新階段。(如圖1)
從2013年到2020年,數字宇宙規模將增長10倍,每年產生的數據量由當前的4.4萬億GB,增長至44萬億GB,每兩年翻一番。中國的數據量在2013年達576EB,到2020年將會達到8060EB,增長13倍。到2020年,中國的數據量在整個數字宇宙中的比例將達到18%,數據規模將超過美國,位居世界第一。
在上述時代背景下,大數據在我國得到了廣泛重視。《大數據標準化白皮書(2016)》指出,我國正處于工業化向信息化發展的轉型時期,信息的公開、共享和服務成為時代發展的主題,開發和利用信息資源十分重要。阿里巴巴等互聯網企業紛紛推出自己的大數據分析工具,使這一領域呈現快速發展的態勢。
2016年中國大數據發展趨勢表現出如下特點:云計算和大數據深度融合;圍繞數據生產、開發、服務和流通的大數據生態系統正在構建;開源技術不斷進步,互聯網公司開啟了大數據技術和模式創新。全社會的大數據產業生態正蓬勃發展。
也正是在這一背景下,教育信息化的發展進程中出現了“教育大數據”這一技術形態,并對“互聯網+”時代的教育信息化產生深刻的影響。
楊現民等人在《教育大數據的應用模式與政策建議》一文中,對教育大數據的作用進行了較為系統的闡述,并就如何推動教育大數據發展提出了六點建議;在《發展教育大數據:內涵、價值和挑戰》一文中,對教育大數據結構模型進行了闡述,并就我國教育大數據發展中面臨的應用落地、數據安全、數據治理與運營等挑戰進行了描述。
孟志遠等人描述了“大數據驅動的教育變革”國際研討會暨首屆中國教育大數據發展論壇中關于教育大數據的研討。該研討會涉及三個方向:一是大數據變革教育的理論思辨研究,體現在利用教育大數據轉變教育思路、改變教學方式、轉變評價觀念、建設教育治理體系等方面;二是基于教育大數據的教育現狀解讀,對各種渠道獲取的教育大數據背后蘊藏的教育現狀進行分析與展示;三是相關技術介紹,包括新興的大數據計算理論,以及傳統技術手段與定量研究方法的新應用。
當前,伴隨移動終端泛在化及物聯網技術的發展,數據采集正在向非結構化、過程性的數據轉變。數據之于教育教學的意義和價值日益凸顯,從繁雜的教育數據中發現相關關系、診斷現存問題、預測發展趨勢,對實現個性化學習、輔助教育科學決策等方面具有重要作用。基于大數據的學業診斷與提升,以及基于大數據的園所科學化管理等應用案例越來越多地呈現,教育大數據研究與應用進入了快速發展階段。
2016年4月,《中國基礎教育大數據發展藍皮書(2015)》發布,對教育大數據的應用模式進行了歸納,包括驅動教育政策科學化、驅動教育評價體系重構、推動區域教育均衡發展、助推學校教育質量提升以及促進師生個性化發展,并提出七大常用的教育數據分析模型,包括決策支持模型、校情監測模型、適應性學習模型、學業評價模型、學習預警模型、深度學習行為診斷模型和學生畫像模型等,教育數據的系統化發展和應用得到越來越廣泛的重視。
二、推進教育數據的教育教學應用
面對大數據時代的來臨,我們一方面要理解大數據及其支撐技術發展的前沿狀態;另一方面,也要理解我國教育信息化建設發展進程中教育數據基礎環境的基本現狀,教育大數據應用發展的進程才剛剛開始。我們要宣傳、關注和應用教育數據,從各級各類教育業務發展中推進數據的生成、匯聚和應用,特別是廣大一線教師要用數據來改變“經驗性”教學實踐,成為能用數據、想用數據和善用數據的一線教師;同時,教育系統中的各級各類教育管理人員,更應該基于數據開展精準管理,推動教育綜合治理的能力建設。伴隨教育大數據領域的發展,數據之于教育教學應用發展的意義日益得到實踐,下面通過一些案例進行說明。
1.數據功能支持的文獻研究
教育科研是廣大一線教師專業發展過程中的必要環節,而文獻研究是教育科研的必然途徑。近幾年來,各類文獻資料庫的數據功能得到了顯著加強。以我們開展的一項關于“高階思維能力”的文獻研究為例,在CNKI上檢索關鍵詞“高階思維能力”,該平臺不但呈現了文獻列表,還提供了計量可視化分析功能。用戶可以選擇部分文獻或全部文獻進行可視化分析,CNKI將根據文獻里的年份、學科、作者、機構等數據信息自動生成多種統計圖形,包括總體趨勢分析、分布分析(涉及學科、作者、機構和文獻來源等類別),以及根據關鍵詞出現頻率和關聯特征自動生成的關系網絡圖。基于這些分析,用戶可以快速獲取其教育科研中核心概念的發展態勢,并根據自己的研究問題,進行整合和討論。
2.基于互聯網教育服務的學習者發展研究
自2013年以來,伴隨在線學習的發展,越來越多的互聯網教育服務走向廣大師生的學習和教學常態化實踐。這些系統覆蓋全國的教育用戶,其學習行為、學習表現能夠持續有效地記錄在系統中,具有“教育大數據”發掘的意義和價值。下面以作業盒子小學(原速算盒子)、小象數據研究院發起的“全國小學生數學能力在線評測”活動為例。
該評測活動是全國范圍內首次跨區域、跨教材版本、跨年級的摸底考查行動,評測時間設定在2017年3月6日至16日,共吸引全國31個省、市、自治區近8000所學校,超過80萬師生同時在線參與評測,創同類評測活動參與人數歷史之最。題目布置、答題、批改以及數據生成全部在線完成。在指定評測時間內,教師通過作業盒子小學將評測題目布置給班群學生,學生在線提交作業,系統自動批改,并從答題時間、正確率、考查能力等多個維度統計區域、班群和個體的差異,據此形成研究報告。
本次評測活動所用題庫緊緊圍繞教學大綱和數學核心素養的基本要求,注重對不同維度數學能力的考查,包括數感、符號意識、空間觀念、幾何直觀、數據分析觀念、運算能力、推理能力和模型思想等。通過科學的題量設計和答題時間設置,充分考查不同區域、不同教材版本以及不同年級學生的知識點掌握情況和數學能力的分布狀況。此次活動在短時間內集中采集了超過1.2億條評測數據,通過大數據平臺集中處理后自動生成可視化、數據化的數學能力分布圖表,并在專家的分析解讀后,形成具有可操作性的教學建議,突破了傳統評測在區域、時間、人力、成本和效果等諸多方面的局限。下面將一些數據進行呈現。
作為第一次跨區域、跨教材版本、跨年級的小學生數學能力在線評測活動,本次活動共覆蓋全國31個省、市、自治區,7596所學校,20174位教師,825878位學生。從參與度上來看,湖南、山東兩省參與度排在全國前列。
1~4年級題量設計相同,答題平均用時呈遞增趨勢。5~6年級題量相同,但答題用時差距較大。(如圖2)
本次評測中,組委會將題目比對數學能力進行了標簽化處理,進而對不同年級數學綜合能力分布進行了量化考查,差異明顯。(如圖3)
報告在數學核心素養能力方面增加了區域對比維度,抽取了上海、北京、吉林長春、湖南益陽四個城市與全國平均水平進行比對。調查發現了一些較為明顯的差異,以上海為例。(如圖4)
3.基于大數據分析下的個性化學習策略研究
伴隨教育大數據領域的發展,個性化學習支持與服務成為備受關注的實踐領域,并同廣大一線教師和學生的常態教學、學習實踐相結合。
科大訊飛智學網提供針對數學、物理、化學等學科的個性化智能教學方案。通過個性化智能教學系統收集教育大數據,智學網提供精準數據分析,實現精準評測和精準推薦。
系統根據學生真實作答數據,智能診斷出每個學生的知識點掌握情況,測評出薄弱環節,并基于科大訊飛人工智能推薦引擎提供個性化學習資源,助力教師因材施教,幫助學生查漏補缺,系統化改進學校教與學的形態,全面提升學校的信息化應用能力和教學服務水平。(如圖5)智學網個性化教與學服務促進了師生教與學方式的變化。
目前該系統已經在合肥一中、合肥六中、南京一中、寧波二中、黃廣中學、南昌三中等學校使用,在學生成績的提高方面取得了明顯進步。
合肥一中高一年級2016年上學年周練5數學總體效果如表1。
黃廣中學高二年級2016年10月月考(理科)化學總體效果如表2。
4.基于“雙課堂”各類交互數據支持語文專題教學
教育數據不僅用于支持精準調優的教學實踐,更用于促進課堂向支持學生能力發展的高階課堂生態方向發展,以筆者所在團隊與北京五中合作的“雙課堂”深化發展研究為例。“雙課堂”,即常態的“現實課堂”與基于網絡教育服務平臺搭建的“虛擬課堂”。將二者適當融合,構成一個新型的教學環境,憑借這一環境所開展的教學可稱為“雙課堂”教學。在這一教學環境中,“虛擬課堂”以網絡平臺為依托,分別為學生和教師提供云端的個人中心和公共平臺。教師轉變為學生的指導者,學生則可以在教師的指引下進行個性化自主學習,并且能隨時隨地與教師、同學進行交流探討。“現實課堂”中,教師可以與學生面對面交流,解決學生的共性問題,從而保證了學生學習內容的統一及整體學習質量的提升。
在上述“雙課堂”教學環境中,如何充分發揮兩類課堂各自的優勢,使“現實課堂”成為促進學生核心素養和學科能力發展的課堂,是非常重要的研究話題。本團隊與北京五中王屏萍老師團隊開展合作,充分發揮行為數據、交互數據、作品數據的價值,挖掘這些數據背后所反映的學生學習狀態、學習認知建構效果、學生思維發展品質。下面以王老師“雙課堂”教學中某一主題的語文教學為例,通過“雙課堂”支持系統所積累的數據進行分析。
例1:學生參與交互的行為狀態分析
利用UCINET軟件對其進行社會網絡分析,可以得到“地壇中那些景物”主題的交互網絡圖。(如圖6)可以看出,除了授課教師,仲同學與其他人的交互最多,反映出他在本次討論中表現最為活躍。另外,從他被回復的情況可以看出,他的發言經常被其他同學回復,能引發其他人思考討論,或者他發言的角度新穎,能夠引發質疑等。除了仲同學之外,田同學、王同學、張同學在本次討論中的發言也相對比較積極。可以看出,這幾位活躍發言的同學成為幾組討論的中心,撐起了這次討論的交互網絡。
例2:認知建構導向的交互行為頻次統計
學習者的認知建構是教學實踐中有重要意義的實踐話題,不同的認知建構狀態反映了“雙課堂”教學生態中意義建構的指向和效果。在所選定的教學專題中(如圖7),闡述/附議和知識共建/意義挖掘所占比例最大,分別為32%和30%。說明在本次討論中,大多數學生趨向于發表自己的觀點,或針對別人的觀點進行補充和探討。同時,駁斥/否定占22%,僅次于前兩者,主要表現在對他人的觀點提出質疑,進行反駁,這反映出學生在該帖中的討論相對激烈,能進行思維的碰撞。審視/修改和其他分別占8%和6%,主要表現在學生能結合別人提出的觀點來反思調整自己的想法,同時表達感謝或者對他人的想法表示贊揚。總結觀點占比最少,僅為2%,反映出只有少數學生能有意識地梳理大家的發言,并邏輯清晰地闡述對問題的全面認識,大多數學生還是趨向于就問題的單個角度進行闡述或討論。本次討論中,學生在“虛擬課堂”中實現了合作學習,能通過意義共建、駁斥否定等方式共同建構對知識的理解,反映了合作學習的本質。
例3:基于SOLO分類框架的學習者思維發展呈現
學習者的思維發展越來越成為課堂教學追求的目標。研究中,選取某一專題活躍度較高的五位同學,利用SOLO分類理論框架,對他們2013年至2015年間在論壇中發表的帖子進行編碼,旨在考查學生的發言質量和思維發展趨勢。(如圖8)從中可以看出,學生在2013年的思維表現相對不穩定,從整體發展趨勢可以看出學生的思維層次逐漸由低到高,表現為前期的分數主要在3以下,后期的分數在3以上(12月份后期分數值降低可能是因為臨近期末,學生的帖子質量受到影響)。由此可見,學生在“虛擬課堂”上進行討論時,思維逐漸由單一結構走向多元結構。
上述一組案例,從面向應用視角讓我們體驗到教育數據應用的意義和價值。只有積極主動地關注教育數據,應用教育數據,教育大數據才能有切實發展的可能。
而另一方面,我們也能夠深刻感受到,教育數據的應用面向教育科研、教育管理、學習發展及教學優化,特別在變革課堂教學、建構面向學生核心素養提升和21世紀能力發展的課堂等方面,都具有了切實有效的實踐可能。
期待廣大教師積極參與到教育數據應用發展的進程中,并以您的智慧和實踐為我國教育現代化的進程貢獻力量。
李玉順 清華大學博士,副教授,數字學習與教育公共服務教育部工程研究中心副主任,中國教育發展戰略協會教育信息化專業委員會專家、北京市中小學百所數字校園實驗項目指導專家、北京數字學校發展戰略研究核心專家、國家數字化學習資源中心高級研究員。現任職于北京師范大學教育學部,研究方向為泛在學習、適應性智能學習系統、中小學數字校園與區域教育信息化等。