精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

當前位置:大數據業界動態 → 正文

大數據時代的數據困惑

責任編輯:editor005 作者:高書國 |來源:企業網D1Net  2015-06-02 14:18:15 本文摘自:《教育科學研究》

維克托·邁爾-舍恩伯格(Viktor Mayer-Schnberger)是最早洞見大數據時代發展趨勢的數據科學家之一,2012年出版的《大數據》一書是“大數據”系統研究的先河之作。進入21世紀第二個十年,人類正式拉開了從小數據時代進入大數據時代的序幕。英國學者維克托·邁爾-舍恩伯格和肯尼思·庫克耶在其著作中提出世界進入大數據時代:“大數據開啟了一次重大的時代轉型。”“這僅只是一個開始,大數據時代對我們的生活,以及與世界交流的方式都提出了挑戰。最驚人的是,社會需要放棄它對因果關系的渴求,而僅需關注相關關系。也就是說只需要知道是什么,而不需要知道為什么。這就推翻了自古以來的慣例,而我們做決定和理解現實的最基本方式也將受到挑戰。”[1]與全球大數據景象相比,教育信息化、數據化相對滯后,教育領域或成為大數據時代的“慢熱領域”。教育特別是教育研究面臨大數據時代的新的數據挑戰和數據困惑。

一、從小數據時代進入大數據時代

人類原始時代早期所創造的數的概念、數的方法和數的科學,為東西方文化的發展提供了共同的智慧財富。人類對于數據價值的認識可以粗略地分為三個階段:一是以經驗科學為基礎判斷數據價值的“小數據”時代;二是以計算機為基礎追求數據精細化時代——從小數據向大數據過渡時期;三是以系統性數據資源為基礎深入挖掘數據關系的大數據時代。

(一)以經驗科學為基礎判斷數據價值的“小數據”時代

早在數千年以前人類就開始計量數據、運用數據和分析數據。人類有記載的、最早的計數發生在公元前8000年。中國古書《易·系辭下》有記載:“上古結繩而治,后世圣人易之以書契。”古書《易九家言》記載為:“事大,大結其繩;事小,小結其繩,之多少,隨物眾寡。”在西方,自圣經時代開始,政府就通過人口普查來建立大型的國民數據庫。[2]同樣,在古代波斯也有結繩記事的記載。據說波斯王大流士給他的指揮官們一根打了60個結的繩子,并對他們說:“愛奧尼亞的男子漢們,從你們看見我出征塞西亞人那天起,每天解開繩子上的一個結,到解完最后一個結那天,要是我不回來,就收拾你們的東西,自己開船回去。”[3]

從古代人結繩記事起,人類數十萬年依靠數量概念和數量科學推動著社會經濟與人類自身的發展。人類的先知們憑借自身與觀察到的經驗,發現了數據對于自然界的物質生產、社會界的精神生產以及人類自身的自我生產、存在與發展的重要價值。

人口普查是一種國家層次的重要的“數據指標行動”。據有關資料記載,中國是世界上最早統計人口的國家之一。相傳最早在公元前210多年前的夏禹時代就有過人口統計。中國古代封建王朝設立戶部,“戶部”主管戶口、賦稅等,是負責統計人口的機構。西周的人口統計不但有公開的人口調查,還有專司人口統計的官吏,稱為“司民”。《周禮·秋官》載:“司民,掌登萬民之數,自生齒以上,皆書于版,辨其國中,與其都鄙,及其郊野,異其男女,歲登下其死生。”這里,我們不難看出,周朝時人口普查就已經初步設立了年齡、“國別”、城鄉、男女、生死等人口的重要指標。東漢時期的戶口調查進一步制度化,稱為“案比”,即案驗、比較,在每年的八月進行。中國魏晉時期皇甫謐著《帝王世紀》有記載:“禹平水土,還為九州,今禹貢是也。是以其時九州之地,凡二千四百三十萬八千二十四頃,定墾者九百三十萬六千二十四頃,不定墾者千五百萬二千頃。民口千三百五十五萬三千九百二十三人。”南朝宋范曄《后漢書》與宋元之際馬端臨《文獻通考》,都有同樣記載。有的統計學者認為這是“我國最早的統計數字資料”。在數千年的農業社會中,人類不斷探索新的科學技術,但是對于統計數據的收集、挖掘和使用始終處于較低水平。

(二)以計算機為基礎追求數據精細化時代

計算機技術的發展與進步,成為20世紀影響經濟社會和科技發展最為重要的事件之一。以計算機技術為引領的信息化、數字化時代,為數據收集、整理、分析和使用提供了前所未有的便利——數據收集更加便捷,數據整理更加科學,數據分析更加深入,數據使用更加廣泛。但是,這一階段計算機技術的主要應用范圍局限在數值領域,追求數據的豐富性和精細化,成為這一階段數據發展的典型特點。

1997年《經濟合作與發展組織教育要覽》明確指出:“在現今的教育可比數據管理上仍有不足之處。因而,迄今所取得的進步已清楚表明在指標的涵蓋范圍、有效性、可比性、精確性和及時性上,還需要做很大的進一步改進。”[4]從更加科學的角度分析,在計算機出現之前,人類的經濟和政治生活根本就不是以數據為基礎的時代,進一步說“小數據時代是計算機背景下以數據為基礎的時代”。小數據時代,由于數據的緊缺,研究者更加追求數據的精確性。中國學者張芳認為:“傳統的統計數據質量僅僅指其準確性,通常用統計估計中的誤差來衡量。但‘質量’的概念被拓寬以后,‘統計數據質量’的概念也有必要拓寬。從ISO關于質量的定義出發,把用戶的需求作為衡量統計數據質量高低的首要因素,那么可以把統計數據質量定義為‘影響統計數據滿足用戶需求的特征’。”[5]

自20世紀90年代起,網絡技術、數碼技術和電子信息系統的發展,推進計算機技術從數值領域發展到非數值領域。數據技術經歷了一次革命性的變化,多媒體技術使得文字、圖形、影像、音響和動畫技術融為一體,數據的生產、復制和儲存能力急驟增長。世界各國相繼實施和推進數字化戰略,數字城市、數字社區和數字家庭不斷涌現。從磁盤、光盤,到互聯網,傳統媒體數字化轉型,以手機帶動的新型傳輸方式的發展,極大地提升了大規模數據傳輸速度。人類開始從小數據時代向大數據時代過渡。

(三)以數據戰略資源深入挖掘數據關系的大數據時代

美國人邁克爾·考克斯和大衛·埃爾斯沃思被認為是第一次提出“大數據”概念的工程師。1997年10月,邁克爾·考克斯和大衛·埃爾斯沃思在第八屆美國電氣和電子工程師協會(IEEE)關于可視化的會議論文集中發表了《為外存模型可視化而應用控制程序請求頁面調度》的文章。“可視化對計算機系統提出了一個有趣的挑戰:通常情況下數據集相當大,耗盡了主存儲器、本地磁盤甚至是遠程磁盤的存儲容量。我們將這個問題稱為大數據。當主存儲器(內核)無法容納數據集,或者當本地磁盤都無法容納數據集的時候,最常用的解決辦法就是獲取更多的資源。”[6]該文是在美國計算機學會的數字圖書館中第一篇使用“大數據”這一術語的文章。

2000-2010年,被視為“大數據時代”的奠基之年。互聯網數據中心估計,2002年世界產生了5EB新數據,2006年為161EB數據,并預測在2006年至2010年間,每年為數字宇宙所增加的信息將是以上數字的六倍多,達到988EB,或者說每18個月就翻一番。而實際上,據2010年和2011年同項研究所發布的信息,每年全球所創造的數字化數據總量超過了這個預測,2010年達到了1200EB,2011年增長到了1800EB。

2012年,數據量已經從TB(1024GB=1TB)級別躍升到PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)級別。國際數據公司(IDC)的研究結果表明,2008年全球產生的數據量為0.49ZB,2009年的數據量為0.8ZB,2010年增長為1.2ZB,2011年的數據量更是高達1.82ZB,相當于全球每人產生200GB以上的數據。而到2012年為止,人類生產的所有印刷材料的數據量是200PB,全人類歷史上說過的所有話的數據量大約是5EB。IBM的研究稱,整個人類文明所獲得的全部數據中,有90%是過去兩年內產生的。而到了2020年,全世界所產生的數據規模將達到今天的44倍。經過十年的發展,新的數據標準、規則更加成熟,無線通信新技術在企業生產、市場流通與大眾消費領域日益擴大。在云計算普及化以及信息環境更加完善的前提下,越來越多的企業、社區和家庭使用更高級別的數據標準,各種層次和各種功能的數據中心如雨后春筍應運而生,數字城市、智能網絡和數據系統不斷涌現。

三是整體國家甚至世界都被數據化。出于政治、軍事、外交和商業利益考慮,國家、地方及國際組織相互“數據化”,共同對敵對國家、合作國家和友好國家實施數據化。公民行為、國家行為被全面數據化。斯諾登揭露的美國政府和安全部門對世界各國的監控丑聞,足以顯示大數據時代國家戰略競爭的激烈程度和殘酷程度。

三種“被數據化”模式,無理化程度一個比一個更嚴重,對于消費者和公民個人合法權利的侵害程度一個比一個更深刻。在國家利益面前,合法的個人隱私喪失殆盡,成為被犧牲者和不得不犧牲的東西。同時,大數據時代,數據壟斷依然嚴重存在,引發了人們對“數據民主”的懷疑。讓人們感到失望的是,“數據民主”時代并沒有伴隨大數據時代的到來而到來。數據壟斷的目標,一是企業通過獨享數據,可以獲得超額的“數據利潤”。二是政府所進行的數據壟斷,成為一種新權力象征。不僅掌握公章就掌握了權力,而且掌握了數據也掌握了權力。依靠向使用者謀取利益的“數據尋租”現象也相繼產生。

(四)教育仍“遠離”大數據時代,數據短缺現象比較嚴重

整體而言,伴隨教育事業的發展和教育改革的深化,教育統計數據日益豐富。一方面,教育數據持續增長。以中國教育經費統計為例,1990年,《中國教育經費統計資料》為435頁,共70.7萬字;2000年,《中國教育經費統計年鑒》為585頁,78.7萬字,比1990年增加34.5%和11.3%;2012年,《中國教育經費統計年鑒》為615頁,94.8萬字,比2000年增加5.12%和20.6%。同樣,2012年與1990年相比,統計年鑒頁碼增加了180頁(41.4%),文字和數據總量增加了24.1萬字(34.1%),增長比例和增長速度可觀。另一方面,教育數據的增長難以滿足多樣化的教育需求。從教育研究視角分析,數據的困境主要表現在以下幾個方面。

一是公民個人教育與學習數據缺乏。教育是公民發展的第一要務。與發達國家相比,中國的教育統計更加關注國家、學校和教師,而對學生特別是學習者個人缺乏必需的關注。在中國的教育統計中,我們很難找到有關學習者個人學習時間、學習支出、學習回報的相關數據。需要指出,現有統計中反映學生學習質量、學生健康水平和質量保障等教育質量方面的數據缺乏。由于缺少公民個人教育和學習數據,教育研究終日里在“國家層面”轉來轉去,缺少真正反映公民群體需要和公民個人需要的高水平的研究成果。

二是非正規教育特別是終身學習數據缺乏。教育體系的成長有一個漸進的歷史過程。20世紀90年代以來,世界各國制定戰略規劃和相關政策,著力推進正規教育體系的完善與正規教育的普及。由于中國教育管理體制和統計體系存在的分隔問題,非正規教育分別由教育部門、勞動人事部門、工會組織和其他專業部門管理,有關非正規教育和培訓的數據統計難以進行,統計的科學性難以測量,反映政府組織、企業和社區終身學習的數據資料嚴重匱乏。此外,企業教育培訓數據相對封閉。教育作為一個相對完整而封閉的系統自我循環,改制后的企業教育與培訓遠離學校,學校教育與社會教育和企業教育特別是企業教育與培訓需求難以接軌,三者“老死不相往來”。教育與培訓體系給教育信息管理數據化帶來體制性制約。

三是關鍵地區和關鍵領域統計數據缺乏。統計數據的專業化是數據統計與數據應用的一大陷阱。由于地區行政管理體制不同,區域之間缺少數據的協作與協調,研究與決策過程中常常缺少能夠反映一個區域的數據和指標。比如,有關長三角、珠三角、環渤海的數據,有關東部地區、中部地區和西部地區人口發展和教育發展的數據,均難以獲得。學前教育和民族教育都是中國教育發展的重點領域和薄弱環節,中央和地方在進行學前教育發展研究與決策時,缺少學前教育和民族教育學齡人口、師資規模、辦學條件、經費需求和社會需要等方面的數據,許多數據只能從個案調研中獲得,直接影響教育研究水平和決策效果。

四是教育數據分析能力十分薄弱。教育研究機構的整體數據分析能力不能適應教育改革和發展特別是重大決策的需要。教育數據分析人才短缺,分析能力薄弱,分析成果嚴重不足。2012年,教育部曾組織全國中小學生健康情況調查,幾乎收集了全國所有中小學生的健康情況數據。由于缺少必要的培訓,上報數據問題嚴重;由于缺少分析人員和分析能力,所有數據至今躺在數據管理人員的計算機里,幾乎已經“數死胎中”。

同時,與可以看到的數據相比,還存在一些“看不到”的問題:教育數據統計意識薄弱,統計手段相對落后,教育數據統計指標得不到時時更新;由于分析能力不足,造成經費資源、時間資源和人力資源浪費;缺少公開、豐富、持續的教育數據發布機制。數據的困乏,影響教育決策、教育研究和國民對于教育的知情權。可以說,中國教育統計遠遠沒有進入所謂的大數據時代。

(五)教育數據與國際數據接軌困難,國際可比較性亟待提高

聯合國開發計劃署在2003年人類發展報告中提出:要“加強國際數據系統。對協調一致的國際統計數據的日益需要是一個嚴峻挑戰。盡管更強大的國際統計有賴于國家統計,但是國際統計機構也需要變革。它們必須提高自己的能力來應對新的測量方法的挑戰,并提供及時的數據,縮小數據上的差距和不一致性,改善與國家統計系統的合作,并加強相互間的協調,以提高國際標準和手段,并確保國際數據系列的一致性。”[14]可比較的國際教育統計數據十分缺乏。數據的可比較性是數據和指標的一個本質要求,也是數據能力建設的基本要求。缺乏數據的可比較性,已經成為指標設計和數據分析的最大障礙之一。其原因是:第一,指標設計缺乏國際標準;第二,數據采集口徑缺乏要求,不規范;第三,教育發展階段不相同,是影響各個國家和地區教育統計數據規范和質量的關鍵因素。

要科學判定數據的精確性與數據的模糊性價值。美國學者道格拉斯·W.哈伯德在《數據化決策》一書中一方面反復強調量化是減少不確定性的工具,另一方面又告誡人們:“量化的概念是‘減少不確定性’,而且沒有必要完全消除不確定性,這是本書的核心觀點。”“一個真正的量化過程不需要無限精確。而且,如果沒有報告誤差,也沒有采用抽樣和實驗等實證方法,就認為數字是完全精確的,根本不是真正的量化。”[15]數據的精確性,既可能是一塊蛋糕,也可能是一個陷阱。有時,甚至多樣化的模糊數據和指標更加真實,研究者和決策教育對此必須加以理性的思考和科學的運用。否則,就會如羅伯特·J.德威利斯所說:“如果一個最差勁的測量是唯一可以利用的測量,那么使用它的代價會比得到的好處要大得多。”[16]在有些情況下,局部的精確并不一定反映整體的科學,我們不能簡單地追求數據的精確性,而忘記甚至放棄模糊數據的科學性。

關鍵字:教育決策宋元之際塞西亞

本文摘自:《教育科學研究》

x 大數據時代的數據困惑 掃一掃
分享本文到朋友圈
當前位置:大數據業界動態 → 正文

大數據時代的數據困惑

責任編輯:editor005 作者:高書國 |來源:企業網D1Net  2015-06-02 14:18:15 本文摘自:《教育科學研究》

維克托·邁爾-舍恩伯格(Viktor Mayer-Schnberger)是最早洞見大數據時代發展趨勢的數據科學家之一,2012年出版的《大數據》一書是“大數據”系統研究的先河之作。進入21世紀第二個十年,人類正式拉開了從小數據時代進入大數據時代的序幕。英國學者維克托·邁爾-舍恩伯格和肯尼思·庫克耶在其著作中提出世界進入大數據時代:“大數據開啟了一次重大的時代轉型。”“這僅只是一個開始,大數據時代對我們的生活,以及與世界交流的方式都提出了挑戰。最驚人的是,社會需要放棄它對因果關系的渴求,而僅需關注相關關系。也就是說只需要知道是什么,而不需要知道為什么。這就推翻了自古以來的慣例,而我們做決定和理解現實的最基本方式也將受到挑戰。”[1]與全球大數據景象相比,教育信息化、數據化相對滯后,教育領域或成為大數據時代的“慢熱領域”。教育特別是教育研究面臨大數據時代的新的數據挑戰和數據困惑。

一、從小數據時代進入大數據時代

人類原始時代早期所創造的數的概念、數的方法和數的科學,為東西方文化的發展提供了共同的智慧財富。人類對于數據價值的認識可以粗略地分為三個階段:一是以經驗科學為基礎判斷數據價值的“小數據”時代;二是以計算機為基礎追求數據精細化時代——從小數據向大數據過渡時期;三是以系統性數據資源為基礎深入挖掘數據關系的大數據時代。

(一)以經驗科學為基礎判斷數據價值的“小數據”時代

早在數千年以前人類就開始計量數據、運用數據和分析數據。人類有記載的、最早的計數發生在公元前8000年。中國古書《易·系辭下》有記載:“上古結繩而治,后世圣人易之以書契。”古書《易九家言》記載為:“事大,大結其繩;事小,小結其繩,之多少,隨物眾寡。”在西方,自圣經時代開始,政府就通過人口普查來建立大型的國民數據庫。[2]同樣,在古代波斯也有結繩記事的記載。據說波斯王大流士給他的指揮官們一根打了60個結的繩子,并對他們說:“愛奧尼亞的男子漢們,從你們看見我出征塞西亞人那天起,每天解開繩子上的一個結,到解完最后一個結那天,要是我不回來,就收拾你們的東西,自己開船回去。”[3]

從古代人結繩記事起,人類數十萬年依靠數量概念和數量科學推動著社會經濟與人類自身的發展。人類的先知們憑借自身與觀察到的經驗,發現了數據對于自然界的物質生產、社會界的精神生產以及人類自身的自我生產、存在與發展的重要價值。

人口普查是一種國家層次的重要的“數據指標行動”。據有關資料記載,中國是世界上最早統計人口的國家之一。相傳最早在公元前210多年前的夏禹時代就有過人口統計。中國古代封建王朝設立戶部,“戶部”主管戶口、賦稅等,是負責統計人口的機構。西周的人口統計不但有公開的人口調查,還有專司人口統計的官吏,稱為“司民”。《周禮·秋官》載:“司民,掌登萬民之數,自生齒以上,皆書于版,辨其國中,與其都鄙,及其郊野,異其男女,歲登下其死生。”這里,我們不難看出,周朝時人口普查就已經初步設立了年齡、“國別”、城鄉、男女、生死等人口的重要指標。東漢時期的戶口調查進一步制度化,稱為“案比”,即案驗、比較,在每年的八月進行。中國魏晉時期皇甫謐著《帝王世紀》有記載:“禹平水土,還為九州,今禹貢是也。是以其時九州之地,凡二千四百三十萬八千二十四頃,定墾者九百三十萬六千二十四頃,不定墾者千五百萬二千頃。民口千三百五十五萬三千九百二十三人。”南朝宋范曄《后漢書》與宋元之際馬端臨《文獻通考》,都有同樣記載。有的統計學者認為這是“我國最早的統計數字資料”。在數千年的農業社會中,人類不斷探索新的科學技術,但是對于統計數據的收集、挖掘和使用始終處于較低水平。

(二)以計算機為基礎追求數據精細化時代

計算機技術的發展與進步,成為20世紀影響經濟社會和科技發展最為重要的事件之一。以計算機技術為引領的信息化、數字化時代,為數據收集、整理、分析和使用提供了前所未有的便利——數據收集更加便捷,數據整理更加科學,數據分析更加深入,數據使用更加廣泛。但是,這一階段計算機技術的主要應用范圍局限在數值領域,追求數據的豐富性和精細化,成為這一階段數據發展的典型特點。

1997年《經濟合作與發展組織教育要覽》明確指出:“在現今的教育可比數據管理上仍有不足之處。因而,迄今所取得的進步已清楚表明在指標的涵蓋范圍、有效性、可比性、精確性和及時性上,還需要做很大的進一步改進。”[4]從更加科學的角度分析,在計算機出現之前,人類的經濟和政治生活根本就不是以數據為基礎的時代,進一步說“小數據時代是計算機背景下以數據為基礎的時代”。小數據時代,由于數據的緊缺,研究者更加追求數據的精確性。中國學者張芳認為:“傳統的統計數據質量僅僅指其準確性,通常用統計估計中的誤差來衡量。但‘質量’的概念被拓寬以后,‘統計數據質量’的概念也有必要拓寬。從ISO關于質量的定義出發,把用戶的需求作為衡量統計數據質量高低的首要因素,那么可以把統計數據質量定義為‘影響統計數據滿足用戶需求的特征’。”[5]

自20世紀90年代起,網絡技術、數碼技術和電子信息系統的發展,推進計算機技術從數值領域發展到非數值領域。數據技術經歷了一次革命性的變化,多媒體技術使得文字、圖形、影像、音響和動畫技術融為一體,數據的生產、復制和儲存能力急驟增長。世界各國相繼實施和推進數字化戰略,數字城市、數字社區和數字家庭不斷涌現。從磁盤、光盤,到互聯網,傳統媒體數字化轉型,以手機帶動的新型傳輸方式的發展,極大地提升了大規模數據傳輸速度。人類開始從小數據時代向大數據時代過渡。

(三)以數據戰略資源深入挖掘數據關系的大數據時代

美國人邁克爾·考克斯和大衛·埃爾斯沃思被認為是第一次提出“大數據”概念的工程師。1997年10月,邁克爾·考克斯和大衛·埃爾斯沃思在第八屆美國電氣和電子工程師協會(IEEE)關于可視化的會議論文集中發表了《為外存模型可視化而應用控制程序請求頁面調度》的文章。“可視化對計算機系統提出了一個有趣的挑戰:通常情況下數據集相當大,耗盡了主存儲器、本地磁盤甚至是遠程磁盤的存儲容量。我們將這個問題稱為大數據。當主存儲器(內核)無法容納數據集,或者當本地磁盤都無法容納數據集的時候,最常用的解決辦法就是獲取更多的資源。”[6]該文是在美國計算機學會的數字圖書館中第一篇使用“大數據”這一術語的文章。

2000-2010年,被視為“大數據時代”的奠基之年。互聯網數據中心估計,2002年世界產生了5EB新數據,2006年為161EB數據,并預測在2006年至2010年間,每年為數字宇宙所增加的信息將是以上數字的六倍多,達到988EB,或者說每18個月就翻一番。而實際上,據2010年和2011年同項研究所發布的信息,每年全球所創造的數字化數據總量超過了這個預測,2010年達到了1200EB,2011年增長到了1800EB。

2012年,數據量已經從TB(1024GB=1TB)級別躍升到PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)級別。國際數據公司(IDC)的研究結果表明,2008年全球產生的數據量為0.49ZB,2009年的數據量為0.8ZB,2010年增長為1.2ZB,2011年的數據量更是高達1.82ZB,相當于全球每人產生200GB以上的數據。而到2012年為止,人類生產的所有印刷材料的數據量是200PB,全人類歷史上說過的所有話的數據量大約是5EB。IBM的研究稱,整個人類文明所獲得的全部數據中,有90%是過去兩年內產生的。而到了2020年,全世界所產生的數據規模將達到今天的44倍。經過十年的發展,新的數據標準、規則更加成熟,無線通信新技術在企業生產、市場流通與大眾消費領域日益擴大。在云計算普及化以及信息環境更加完善的前提下,越來越多的企業、社區和家庭使用更高級別的數據標準,各種層次和各種功能的數據中心如雨后春筍應運而生,數字城市、智能網絡和數據系統不斷涌現。

三是整體國家甚至世界都被數據化。出于政治、軍事、外交和商業利益考慮,國家、地方及國際組織相互“數據化”,共同對敵對國家、合作國家和友好國家實施數據化。公民行為、國家行為被全面數據化。斯諾登揭露的美國政府和安全部門對世界各國的監控丑聞,足以顯示大數據時代國家戰略競爭的激烈程度和殘酷程度。

三種“被數據化”模式,無理化程度一個比一個更嚴重,對于消費者和公民個人合法權利的侵害程度一個比一個更深刻。在國家利益面前,合法的個人隱私喪失殆盡,成為被犧牲者和不得不犧牲的東西。同時,大數據時代,數據壟斷依然嚴重存在,引發了人們對“數據民主”的懷疑。讓人們感到失望的是,“數據民主”時代并沒有伴隨大數據時代的到來而到來。數據壟斷的目標,一是企業通過獨享數據,可以獲得超額的“數據利潤”。二是政府所進行的數據壟斷,成為一種新權力象征。不僅掌握公章就掌握了權力,而且掌握了數據也掌握了權力。依靠向使用者謀取利益的“數據尋租”現象也相繼產生。

(四)教育仍“遠離”大數據時代,數據短缺現象比較嚴重

整體而言,伴隨教育事業的發展和教育改革的深化,教育統計數據日益豐富。一方面,教育數據持續增長。以中國教育經費統計為例,1990年,《中國教育經費統計資料》為435頁,共70.7萬字;2000年,《中國教育經費統計年鑒》為585頁,78.7萬字,比1990年增加34.5%和11.3%;2012年,《中國教育經費統計年鑒》為615頁,94.8萬字,比2000年增加5.12%和20.6%。同樣,2012年與1990年相比,統計年鑒頁碼增加了180頁(41.4%),文字和數據總量增加了24.1萬字(34.1%),增長比例和增長速度可觀。另一方面,教育數據的增長難以滿足多樣化的教育需求。從教育研究視角分析,數據的困境主要表現在以下幾個方面。

一是公民個人教育與學習數據缺乏。教育是公民發展的第一要務。與發達國家相比,中國的教育統計更加關注國家、學校和教師,而對學生特別是學習者個人缺乏必需的關注。在中國的教育統計中,我們很難找到有關學習者個人學習時間、學習支出、學習回報的相關數據。需要指出,現有統計中反映學生學習質量、學生健康水平和質量保障等教育質量方面的數據缺乏。由于缺少公民個人教育和學習數據,教育研究終日里在“國家層面”轉來轉去,缺少真正反映公民群體需要和公民個人需要的高水平的研究成果。

二是非正規教育特別是終身學習數據缺乏。教育體系的成長有一個漸進的歷史過程。20世紀90年代以來,世界各國制定戰略規劃和相關政策,著力推進正規教育體系的完善與正規教育的普及。由于中國教育管理體制和統計體系存在的分隔問題,非正規教育分別由教育部門、勞動人事部門、工會組織和其他專業部門管理,有關非正規教育和培訓的數據統計難以進行,統計的科學性難以測量,反映政府組織、企業和社區終身學習的數據資料嚴重匱乏。此外,企業教育培訓數據相對封閉。教育作為一個相對完整而封閉的系統自我循環,改制后的企業教育與培訓遠離學校,學校教育與社會教育和企業教育特別是企業教育與培訓需求難以接軌,三者“老死不相往來”。教育與培訓體系給教育信息管理數據化帶來體制性制約。

三是關鍵地區和關鍵領域統計數據缺乏。統計數據的專業化是數據統計與數據應用的一大陷阱。由于地區行政管理體制不同,區域之間缺少數據的協作與協調,研究與決策過程中常常缺少能夠反映一個區域的數據和指標。比如,有關長三角、珠三角、環渤海的數據,有關東部地區、中部地區和西部地區人口發展和教育發展的數據,均難以獲得。學前教育和民族教育都是中國教育發展的重點領域和薄弱環節,中央和地方在進行學前教育發展研究與決策時,缺少學前教育和民族教育學齡人口、師資規模、辦學條件、經費需求和社會需要等方面的數據,許多數據只能從個案調研中獲得,直接影響教育研究水平和決策效果。

四是教育數據分析能力十分薄弱。教育研究機構的整體數據分析能力不能適應教育改革和發展特別是重大決策的需要。教育數據分析人才短缺,分析能力薄弱,分析成果嚴重不足。2012年,教育部曾組織全國中小學生健康情況調查,幾乎收集了全國所有中小學生的健康情況數據。由于缺少必要的培訓,上報數據問題嚴重;由于缺少分析人員和分析能力,所有數據至今躺在數據管理人員的計算機里,幾乎已經“數死胎中”。

同時,與可以看到的數據相比,還存在一些“看不到”的問題:教育數據統計意識薄弱,統計手段相對落后,教育數據統計指標得不到時時更新;由于分析能力不足,造成經費資源、時間資源和人力資源浪費;缺少公開、豐富、持續的教育數據發布機制。數據的困乏,影響教育決策、教育研究和國民對于教育的知情權。可以說,中國教育統計遠遠沒有進入所謂的大數據時代。

(五)教育數據與國際數據接軌困難,國際可比較性亟待提高

聯合國開發計劃署在2003年人類發展報告中提出:要“加強國際數據系統。對協調一致的國際統計數據的日益需要是一個嚴峻挑戰。盡管更強大的國際統計有賴于國家統計,但是國際統計機構也需要變革。它們必須提高自己的能力來應對新的測量方法的挑戰,并提供及時的數據,縮小數據上的差距和不一致性,改善與國家統計系統的合作,并加強相互間的協調,以提高國際標準和手段,并確保國際數據系列的一致性。”[14]可比較的國際教育統計數據十分缺乏。數據的可比較性是數據和指標的一個本質要求,也是數據能力建設的基本要求。缺乏數據的可比較性,已經成為指標設計和數據分析的最大障礙之一。其原因是:第一,指標設計缺乏國際標準;第二,數據采集口徑缺乏要求,不規范;第三,教育發展階段不相同,是影響各個國家和地區教育統計數據規范和質量的關鍵因素。

要科學判定數據的精確性與數據的模糊性價值。美國學者道格拉斯·W.哈伯德在《數據化決策》一書中一方面反復強調量化是減少不確定性的工具,另一方面又告誡人們:“量化的概念是‘減少不確定性’,而且沒有必要完全消除不確定性,這是本書的核心觀點。”“一個真正的量化過程不需要無限精確。而且,如果沒有報告誤差,也沒有采用抽樣和實驗等實證方法,就認為數字是完全精確的,根本不是真正的量化。”[15]數據的精確性,既可能是一塊蛋糕,也可能是一個陷阱。有時,甚至多樣化的模糊數據和指標更加真實,研究者和決策教育對此必須加以理性的思考和科學的運用。否則,就會如羅伯特·J.德威利斯所說:“如果一個最差勁的測量是唯一可以利用的測量,那么使用它的代價會比得到的好處要大得多。”[16]在有些情況下,局部的精確并不一定反映整體的科學,我們不能簡單地追求數據的精確性,而忘記甚至放棄模糊數據的科學性。

關鍵字:教育決策宋元之際塞西亞

本文摘自:《教育科學研究》

電子周刊
回到頂部

關于我們聯系我們版權聲明隱私條款廣告服務友情鏈接投稿中心招賢納士

企業網版權所有 ©2010-2024 京ICP備09108050號-6 京公網安備 11010502049343號

^
  • <menuitem id="jw4sk"></menuitem>

    1. <form id="jw4sk"><tbody id="jw4sk"><dfn id="jw4sk"></dfn></tbody></form>
      主站蜘蛛池模板: 怀宁县| 凌海市| 含山县| 黎城县| 海口市| 靖远县| 信丰县| 台湾省| 八宿县| 工布江达县| 永康市| 高陵县| 句容市| 凭祥市| 天镇县| 鲁山县| 黄龙县| 多伦县| 灵山县| 台江县| 元朗区| 北流市| 西充县| 乌拉特前旗| 威信县| 博湖县| 昌宁县| 龙州县| 福州市| 海南省| 松阳县| 河北省| 昭觉县| 通城县| 大兴区| 张家界市| 九龙城区| 扎赉特旗| 雅江县| 龙里县| 修文县|