如果你是一名在校大學(xué)生,或者你是一位大學(xué)英語(yǔ)教師,你或許想知道:一篇優(yōu)秀的英語(yǔ)作文平均句長(zhǎng)多少最合適,哪些不地道的“中國(guó)式”英語(yǔ)搭配出鏡率最高,如何讓多少有些讓人望而生畏的英語(yǔ)寫(xiě)作變得“喜聞樂(lè)見(jiàn)”?新近出爐的《中國(guó)學(xué)生英語(yǔ)寫(xiě)作能力調(diào)查藍(lán)皮書(shū)》會(huì)告訴你答案。
為調(diào)研中國(guó)學(xué)生英語(yǔ)寫(xiě)作能力,中國(guó)高校英語(yǔ)寫(xiě)作教學(xué)協(xié)同創(chuàng)新聯(lián)盟(以下簡(jiǎn)稱“聯(lián)盟”)今年4月以命題作文的形式,征集10萬(wàn)篇學(xué)生作品。截止到5月10日,共有近30萬(wàn)名學(xué)生在線提交了自己的英語(yǔ)作文。聯(lián)盟對(duì)收集到的英語(yǔ)作文進(jìn)行初步分析,形成《中國(guó)學(xué)生英語(yǔ)寫(xiě)作能力調(diào)查藍(lán)皮書(shū)》的數(shù)據(jù)報(bào)告部分,對(duì)相關(guān)數(shù)據(jù)進(jìn)行深度分析和挖掘的工作正在進(jìn)行中。
首都師范大學(xué)副校長(zhǎng)周建設(shè)在接受科技日?qǐng)?bào)記者采訪時(shí)指出,中國(guó)目前有超過(guò)1億在校學(xué)生學(xué)習(xí)英語(yǔ),通過(guò)對(duì)海量教學(xué)數(shù)據(jù)的收集和分析更能客觀真實(shí)地反映學(xué)生英語(yǔ)能力和教學(xué)效果。“大數(shù)據(jù)時(shí)代,如何將大數(shù)據(jù)技術(shù)應(yīng)用到英語(yǔ)寫(xiě)作教學(xué)中,向?qū)W生和老師們提供更多數(shù)據(jù)支持是我們一直在探索的課題”。
大數(shù)據(jù)分析為英語(yǔ)作文提供“診斷”標(biāo)準(zhǔn)
“語(yǔ)言是人類(lèi)思維的載體,研究語(yǔ)言,研究怎么應(yīng)用語(yǔ)言,這是非常值得做的事情,尤其是在大數(shù)據(jù)時(shí)代”,中國(guó)工程院院士李德毅表示。他是在近日召開(kāi)的語(yǔ)言智能與外語(yǔ)能力提升學(xué)術(shù)研討會(huì)上做上述表述的。
為了幫助大家更好地理解大數(shù)據(jù)技術(shù)在英語(yǔ)寫(xiě)作中的應(yīng)用,北京語(yǔ)言智能協(xié)同研究院副院長(zhǎng)張躍舉了個(gè)形象的例子。人們?nèi)メt(yī)院體檢會(huì)測(cè)量血壓,醫(yī)生會(huì)根據(jù)測(cè)到的數(shù)值高低給予相應(yīng)的治療。這里涉及到兩個(gè)問(wèn)題,首先需要一個(gè)測(cè)量血壓的工具來(lái)獲取數(shù)據(jù),同時(shí)對(duì)獲取到的數(shù)據(jù)進(jìn)行評(píng)判還要有一個(gè)診斷標(biāo)準(zhǔn)。而診斷標(biāo)準(zhǔn)緣何而來(lái)呢,勢(shì)必要通過(guò)對(duì)海量數(shù)據(jù)的長(zhǎng)期跟蹤研究。對(duì)英文作文的“診斷”,自然也不例外。
周建設(shè)表示,聯(lián)盟通過(guò)在線平臺(tái)批改網(wǎng)在一個(gè)月的時(shí)間里搜集到近30萬(wàn)篇英語(yǔ)作文,在較短的時(shí)間里獲得體量如此龐大的英語(yǔ)作文電子數(shù)據(jù),這在過(guò)去沒(méi)有相應(yīng)技術(shù)支持的情況下是難以想象的。“接下來(lái),更重要的是對(duì)海量數(shù)據(jù)進(jìn)行分析挖掘,獲取有助于英語(yǔ)作文評(píng)判的數(shù)據(jù)標(biāo)準(zhǔn),同時(shí)對(duì)提高學(xué)生英語(yǔ)作文能力提供有針對(duì)性的建議”。
事實(shí)上,評(píng)判一篇英語(yǔ)作文的優(yōu)劣有很多客觀的維度,比如詞匯豐富度、從句密度、搭配錯(cuò)誤率等等。通過(guò)對(duì)數(shù)據(jù)的初步分析,張躍和同事們有了一些發(fā)現(xiàn)。他告訴科技日?qǐng)?bào)記者,本次搜集到的作文中,平均句長(zhǎng)是20.29個(gè)單詞,系統(tǒng)共標(biāo)記2348695處錯(cuò)誤,其中出現(xiàn)頻率最高的錯(cuò)誤是主謂不一致,占比為16.83%,緊隨其后的是疑似誤用名詞詞組,占比8.83%。
據(jù)介紹,此次英語(yǔ)作文在線征集活動(dòng)共吸引了來(lái)自全國(guó)30個(gè)省份463所學(xué)校的300814名學(xué)生和3876位教師的參與。根據(jù)學(xué)校類(lèi)別的不同,報(bào)告中對(duì)985院校、211院校、普通本科、獨(dú)立學(xué)院、高職高專的學(xué)生作文進(jìn)行了比較分析。“對(duì)于參加人數(shù)超過(guò)3000的學(xué)校,我們會(huì)單獨(dú)為其出具一份報(bào)告,便于其更好地了解學(xué)生英語(yǔ)寫(xiě)作的水平”,張躍表示。
在線互動(dòng)模式讓英語(yǔ)寫(xiě)作化身“升級(jí)”游戲
在英語(yǔ)作文調(diào)研活動(dòng)籌備會(huì)議上,張躍和同事們最初預(yù)想的目標(biāo)是能征集5到10萬(wàn)篇作文。活動(dòng)開(kāi)始后,學(xué)生和老師們的參與熱情著實(shí)出乎張躍的預(yù)料。5月10日本是作文征集活動(dòng)的截止日期,但仍有不少此前沒(méi)趕上參加的學(xué)校要求加入。
對(duì)學(xué)生寫(xiě)作行為數(shù)據(jù)的分析是此次調(diào)研分析的重點(diǎn)之一。報(bào)告顯示,參與本次活動(dòng)的學(xué)生平均修改3.88次,即學(xué)生在老師看到其最終版本之前,已經(jīng)自行修改了3.88次。在收到的265684篇有效學(xué)生作文中,修改2次及以上的篇數(shù)為167234篇,占比62.94%。
令張躍感到吃驚的是,來(lái)自北京工商大學(xué)的一位王同學(xué)將作文修改了225次,其修改次數(shù)位列榜首。
是什么吸引著學(xué)生投入如此大的熱情來(lái)參與此次活動(dòng)?張躍分析道,一個(gè)很重要的原因在于,學(xué)生在線提交作文后只需等待幾秒鐘,就能得到機(jī)器給出的分?jǐn)?shù)和修改建議,根據(jù)反饋修改后再次提交,會(huì)得到比先前更高的分?jǐn)?shù)。“及時(shí)的互動(dòng)性和分?jǐn)?shù)不斷攀升帶來(lái)的成就感,是學(xué)生如此投入的原動(dòng)力,就像打贏了一場(chǎng)場(chǎng)升級(jí)游戲一樣。”
和批改網(wǎng)的及時(shí)反饋相比,現(xiàn)實(shí)中,高校學(xué)生從老師那得到的對(duì)英語(yǔ)作文的反饋相對(duì)滯后。清華大學(xué)外語(yǔ)學(xué)院教授張文霞介紹,由于高校英語(yǔ)老師教學(xué)任務(wù)繁重,學(xué)生交上來(lái)的英文作文往往在半個(gè)月之后才能批改完,收到反饋時(shí)學(xué)生甚至可能都忘記了當(dāng)時(shí)的寫(xiě)作內(nèi)容。
對(duì)此,周建設(shè)有著相同的看法。他多次參與教育部組織的教學(xué)評(píng)估,一次抽查英語(yǔ)作業(yè)本時(shí)發(fā)現(xiàn)一整個(gè)班的英文作文沒(méi)有被批改完。“這不是說(shuō)老師懶,而是老師的工作量確實(shí)太大了,批改作文是一項(xiàng)耗時(shí)費(fèi)力的細(xì)活,如果有好的技術(shù)來(lái)替代這部分工作又何樂(lè)而不為呢?”
機(jī)器能欣賞到英語(yǔ)作文的美感嗎?
人工智能之父、英國(guó)科學(xué)家阿蘭·麥席森·圖靈,早在1950年,就發(fā)表了一篇題為《機(jī)器能思考嗎?》的論文,成為劃時(shí)代之作。
機(jī)器能否像人一樣欣賞英文作文的美感,從立意的角度對(duì)作文進(jìn)行評(píng)判?采訪中,科技日?qǐng)?bào)記者一再向?qū)<覀兦笞C這一問(wèn)題。畢竟一篇作文是有一定思想內(nèi)涵的,不只是一串串沒(méi)有溫度的字符。
對(duì)此,周建設(shè)坦言,目前人工智能技術(shù)沒(méi)有發(fā)展到能讓機(jī)器從立意的角度去考量一篇英語(yǔ)作文。但是,目前英語(yǔ)考試中的作文部分更多的是考察作者的
表達(dá)是否規(guī)范,遣詞造句是否符合語(yǔ)法要求,從這個(gè)角度而言,機(jī)器批改作文是可行的。“事實(shí)上,托福和GRE等大型考試的作文部分都是機(jī)器來(lái)閱卷的”。
批改網(wǎng)在得到許多學(xué)生和老師支持的同時(shí),也面臨著“更看重語(yǔ)言的形式,而不是看語(yǔ)言的內(nèi)容”的批評(píng)。南京大學(xué)外語(yǔ)學(xué)院教授王海嘯則認(rèn)為,批改網(wǎng)的不足給后來(lái)者留下了改進(jìn)的空間。“大數(shù)據(jù)時(shí)代的數(shù)據(jù)是沒(méi)有止盡的,關(guān)鍵在于我們?cè)趺赐冢?rdquo;
清華大學(xué)張文霞教授補(bǔ)充道,批改網(wǎng)提供的數(shù)據(jù)可用于英語(yǔ)寫(xiě)作課堂教學(xué)、評(píng)測(cè)等多個(gè)方面,下一步,應(yīng)將批改網(wǎng)和老師的反饋相結(jié)合,按照各自的需求建立所在學(xué)校的數(shù)據(jù)庫(kù),同時(shí),對(duì)動(dòng)態(tài)的數(shù)據(jù)要且建且用且增加。