過去幾年,用AI輔助司法工作者提升案件處理的效率已成行業(yè)共識(shí),隨著大模型的誕生進(jìn),AI對(duì)案件理解、分析及法律文書生成、報(bào)告生成的能力進(jìn)一步提升,目前,國內(nèi)企業(yè)和高校研究團(tuán)隊(duì)已推出多個(gè)法律大模型,行業(yè)迫切需要一套面向法律AI行業(yè)的評(píng)估指標(biāo)和評(píng)測(cè)方法。
作為行業(yè)首個(gè)《法律大模型評(píng)估指標(biāo)和測(cè)評(píng)方法(征求意見稿)》,其涵蓋法律大模型能力體系、評(píng)估指標(biāo)、測(cè)評(píng)方法、典型應(yīng)用場(chǎng)景等內(nèi)容,適用于法律大模型系統(tǒng)測(cè)試的設(shè)計(jì)和實(shí)施等任務(wù)場(chǎng)景。在評(píng)測(cè)方法內(nèi)容中,針對(duì)特定任務(wù),意見稿提出需從功能、性能、安全、質(zhì)量四個(gè)方面共12項(xiàng)指標(biāo),為法律大模型測(cè)評(píng)提供各項(xiàng)指標(biāo)的選擇、評(píng)分和計(jì)算方法,最終獲得該項(xiàng)任務(wù)的性能測(cè)評(píng)結(jié)果。
智慧司法技術(shù)總師許建峰表示:“大模型為法律人工智能領(lǐng)域帶來了新的機(jī)遇,推出指標(biāo)體系是指導(dǎo)行業(yè)規(guī)范化的基礎(chǔ),我們希望更多行業(yè)從業(yè)者提供反饋和意見,并進(jìn)一步完善法律大模型的評(píng)估標(biāo)準(zhǔn),促進(jìn)法律人工智能更好更快的發(fā)展。”
本次論壇,浙江大學(xué)還聯(lián)合阿里云等發(fā)布了法律大模型智海-錄問和基于通義千問7B模型的教育大模型智海-三樂,智海-錄問具備提供法律問答、知識(shí)檢索增強(qiáng)問答、案情分析、意圖識(shí)別、推理決策、法律文書生成等法律輔助服務(wù)功能,智海-三樂可提供智能問答、試題生成、學(xué)習(xí)導(dǎo)航、教學(xué)評(píng)估等服務(wù)。
據(jù)悉,阿里云在法律AI領(lǐng)域已發(fā)表數(shù)十篇國際頂會(huì)論文,團(tuán)隊(duì)輔助研發(fā)的AI法官助理“小智”已在浙江省高院、黑龍江高院等法院上線應(yīng)用,可將簡(jiǎn)單案件庭審效率提升50%以上,已輔助審理案件超10000件。