世界上最頂尖的律師們,在最新一場和人工智能的對決中輸了。
2月26日,名為LawGeeX的以色列科技創(chuàng)業(yè)公司發(fā)布報告稱,其法律AI平臺與20位來自斯坦福大學等背景的律師比賽審閱法律合同。結果顯示,其AI系統(tǒng)和人類律師平均準確率分別為94%和85%。時間差別更為顯著——律師平均花費92分鐘,AI耗時則僅26秒。
伴隨著大數(shù)據(jù)、人工智能和區(qū)塊鏈等技術熱潮,大量創(chuàng)業(yè)科技公司正涌入法律服務行業(yè),試圖為法官、檢察官和律師提供系統(tǒng)的智能服務,從智能速記員、智能量刑到斷案輔助功能,其野心是實現(xiàn)從“助理”到“決策者”的替代。
不斷增長的案件數(shù)量和結案壓力使得司法系統(tǒng)對此充滿期待;此外,商業(yè)活動中企業(yè)的大量法律服務需求,也催生出科技公司的大量細分機會。然而,對于這一需要大量經(jīng)驗和知識積累的行業(yè)來說,技術事實上仍在被用于解決行業(yè)初級痛點——提高效率減少重復工作。
關于“機器人法官”和變革行業(yè)的暢想,都處在前夜。
AI助力司法嘗試
“即便加班加點,平均每個法官手中仍有211.43件案件無法審結,我們深感愧疚!”2018年伊始,廣西南寧市青秀區(qū)法院門前便張貼出一份倡議書,稱因工作壓力太大,該區(qū)已有15%法官辭職、調(diào)離和提前退休,并有多人積勞成疾;而2018年預計收案超過4萬件,壓力將不減反增,因此呼吁當事人盡可能選擇其他調(diào)解糾紛的手段。
大量法院都面臨著類似的壓力。江蘇省一位基層法官告訴《財經(jīng)》記者,其2017年全年審結案件近300件,盡管涉及疑難案件不多,但簡單重復地審理也讓加班和過勞成為他的生活日常。
最高法院和最高檢察院數(shù)據(jù)顯示,本輪司法改革實行員額制以來,法官和檢察官人數(shù)已從20萬和17萬人分別縮減至12萬和8.4萬人。與此相對,案件數(shù)量則由于立案登記制度的實行猛增。全國法院審結、執(zhí)結的案件,已從2013年的1200多萬件增至2016年的1900多萬件。
巨大審結壓力下,通過引入大數(shù)據(jù)和AI等技術,推廣“智慧法院”系統(tǒng)提高效率,讓機器取代一部分簡單和重復勞作,于司法系統(tǒng)從業(yè)者而言是剛需,于法律科技公司則是商機。
1月29日,京都律師事務所與中國政法大學法學院大數(shù)據(jù)與人工智能法律研究中心聯(lián)合發(fā)布的《2017年度互聯(lián)網(wǎng)法律服務行業(yè)調(diào)研報告》稱,2016年和2017年中國新上線共131家互聯(lián)網(wǎng)法律服務機構,占到業(yè)內(nèi)互聯(lián)網(wǎng)法律機構總量的50%以上,并已進入不同細分領域建立商業(yè)模式。
對基層檢察官而言,對案件證據(jù)情況進行摘錄、歸納以及分析,最終形成審查報告往往占用絕大部分工作時間。梅哲賓是浙江省杭州市余杭區(qū)檢察院的檢察官,其所在部門剛開始試用杭州“智慧公訴”辦案輔助系統(tǒng)。他向《財經(jīng)》記者介紹,這一系統(tǒng)有證據(jù)錄入、事實歸納和風險提示等功能,對以往費時費力的工作帶來改善,實用性很強。
另一個正在落地的是人工智能語音速錄技術,旨在成為“智能書記員”。例如,改變當前庭審筆錄記錄模式,將各方對話自動實時識別成文字,包括合議庭法官的評議過程也實時記錄,提升審判效率,減輕法官和書記員的辦案負荷。
不過,法院要求生成的司法文書準確度極高,而庭審過程受方言、口音以及法律專業(yè)術語等的影響較大。因此,盡管諸如科大訊飛等公司已為許多辦案機構定制輸入系統(tǒng),浙江省高級法院法官程闖的體會是,智能速錄系統(tǒng)對許多同事工作效率提高影響不大。
北京華宇元典信息服務有限公司總經(jīng)理鄒劭坤告訴《財經(jīng)》記者,目前技術界公認語音識別在AI領域已經(jīng)取得明顯突破,不過接下來很大的困難是如何打造專業(yè)團隊對標準數(shù)據(jù)集進行標注,以方便機器學習,從而更加精準識別。
此外,對新技術有極大需求的另一商機在電子存證領域。互聯(lián)網(wǎng)經(jīng)濟使大量行為發(fā)生在線上,稍縱即逝的信息、線索和證據(jù)不加以及時固定和公證,已在實踐中給當事人維權和司法鑒定帶來高成本、不便利等問題。許多公司亦稱正在應用區(qū)塊鏈技術不可篡改和同步性的特征進行電子存證,極富潛力。
另一家法律科技服務公司聯(lián)合信任時間戳的商業(yè)模式為向法院提供諸如訴前證據(jù)保全、電子卷宗、留置送達認證等方面服務,檢察機關則主要應用其電子卷宗、電子證據(jù)固化、勘驗等功能。其創(chuàng)始人張昌利告訴《財經(jīng)》記者,其公司在司法訴訟領域有20多個地區(qū)的150多家法院有采信的司法判例。
不過,對于這些公司而言,如何向相對保守和被動的司法機關證明其可信度是一大難點。
中國政法大學證據(jù)科學研究院工程師、電子數(shù)據(jù)司法鑒定人許曉冬告訴《財經(jīng)》記者,能在司法鑒定中被采用的證據(jù),一方面需要符合國家相應部門的法律規(guī)定,其次需要其在技術上得到認證和確信,保證所采用的電子簽章系統(tǒng)產(chǎn)生的數(shù)據(jù)都是無污染而不可被篡改。而由于缺乏相應國家標準,如何解決這些公司的可信任度問題,他持審慎和保留態(tài)度。
大數(shù)據(jù)痛點
AI技術依賴于大數(shù)據(jù),法律行業(yè)不無例外,司法數(shù)據(jù)的深度挖掘成為必然。
通過挖掘利用海量司法案件資源,提供面向各類訴訟需求的相似案例推送、訴訟結果預判等服務,為減少不必要訴訟提供有力支持,這是目前應用較多的能夠輔助辦案的類案系統(tǒng)。
最高法院先后在2010年、2013年、2016年三次發(fā)布了《關于人民法院在互聯(lián)網(wǎng)公布裁判文書的規(guī)定》,截至2017年上半年,裁判文書公開總量超過3200余萬篇,這為司法數(shù)據(jù)深度挖掘提供了較好的資源基礎。
2017年2月起,上海高級法院研發(fā)團隊運用大數(shù)據(jù)技術對上海原有3萬余份刑事法律文書、9012件典型案例、1695萬條司法信息資源進行比對、分析,通過人工智能的深度研究,針對司法實踐中取證環(huán)節(jié)的易發(fā)、多發(fā)、常見問題,制定證據(jù)標準、證據(jù)規(guī)則,并把這些標準鑲嵌進數(shù)據(jù)化的辦案程序中,推出了“上海刑事案件智能輔助辦案系統(tǒng)”。
在這個系統(tǒng)的倒逼下,“偵查人員從接受案件開始就必須按照規(guī)定來收集固定證據(jù),確保偵查移送起訴案件符合法律規(guī)定的標準和程序”,上海市高級法院院長崔亞東接受《經(jīng)濟日報》采訪時稱,系統(tǒng)還具有證據(jù)校驗、審查判斷等功能,及時發(fā)現(xiàn)、提示證據(jù)中的瑕疵和證據(jù)之間的矛盾,防止“一步錯、步步錯、錯到底”的現(xiàn)象發(fā)生。
此類嘗試無獨有偶。此前一年,廣州市中級法院對歷史上300多萬件同類案件進行大數(shù)據(jù)分析,形成“智審輔助量刑裁決系統(tǒng)”。該系統(tǒng)對影響盜竊案判決的20多種情形、每種情形占多大權重作出分析。當法官輸入案件要素后,系統(tǒng)會在傳統(tǒng)推送相似案例的基礎上自動進行比對和運算,并對量刑幅度給出圖形分析和數(shù)據(jù)參照。
對于這類大數(shù)據(jù)系統(tǒng)的使用情況,司法人員反映不一。
有檢察官說,他們正在試用的“智慧公訴”系統(tǒng)有量刑參考功能,但是因為錄入的生效案件還比較少,無法對部分罪名的量刑提供參考。
北京市海淀區(qū)檢察院檢察官白磊也有同樣感受,負責新科技領域犯罪公訴的他少有使用該類軟件的經(jīng)驗,原因在于高科技類犯罪形式太新無例可循,他的日常工作更多需要進行大量人工判斷和邏輯分析。
不過他告訴《財經(jīng)》記者,這類軟件對于從事普通刑事案件,如盜竊、危險駕駛罪等案件公訴的同事較有幫助。該類案件發(fā)案率高、情節(jié)相似,在提起公訴前使用類案系統(tǒng)查詢同類案件的判案情況,可以參考比對提出更為合理的量刑建議,以確保司法穩(wěn)定性和破解“同案不同判”的問題,更為公平。
然而,利用斷案輔助系統(tǒng)來提高裁判的一致性和可預期性,其實操性一直在業(yè)內(nèi)受到質(zhì)疑。
程闖的擔憂是,如同世界上沒有完全相同的兩片樹葉,也不會有兩個完全相同的案件,如何利用類案系統(tǒng)進行參照?很難說清楚不同的影響因子、不同情節(jié)對量刑的影響比重;另外,判案時信訪風險、考核指標等隱性因素也難以通過類案系統(tǒng)分析。
北京仲裁委員會副秘書長陳福勇亦表示,斷案輔助系統(tǒng)的“一致性”能做到什么程度,有討論余地。特別是對于仲裁這種要求一裁終局、裁決保密的裁判系統(tǒng)而言,無法公開數(shù)據(jù),因此只能在一個機構內(nèi)部應用,實用性有待檢驗。
除此之外,人文關懷也是類案軟件無法解決的一大痛點。
“只有人類法官,才能切實考慮到案件的具體情況,靈活采用附條件不起訴、主持刑事和解、民事調(diào)解等來化解社會矛盾;也才能考慮到當事人的困境,給予司法救助,聯(lián)系相關部門,予以法外關懷。”在程闖看來,目前的技術無法企及,寬嚴相濟的刑事政策將難以實現(xiàn)。
“按照算法推送相應的案件,很難全面、客觀。而自己尋找,可能更有針對性。”程闖認為。
AI如何兼容司法
讓大數(shù)據(jù)輔助量刑之外,更具野心的目標是培養(yǎng)真正的機器人“律師”和“法官”,在機器學習和訓練的基礎上,直接作出法律判斷。而技術不僅需要自身突破,還需解決倫理問題。
2016年底,無訟網(wǎng)絡科技(北京)有限公司推出法律機器人產(chǎn)品“法小淘”,功能在于一方面幫助中小企業(yè)精準匹配相應的律師,另一方面它本身便可以回答簡單法律問題。目前,無訟科技已獲得兩輪1.47億元投資。
無訟科技副總裁莊大衞告訴《財經(jīng)》記者,“法小淘”目前通過對中國裁判文書網(wǎng)大量案例的機器學習,以及對已有法規(guī)、工商系統(tǒng)、法院執(zhí)行信息公開系統(tǒng)等的數(shù)據(jù)學習,來獲取不同行業(yè)法律知識。其目標是,企業(yè)客戶通過自然語言描述自己遇到的法律問題,法小淘可以對問題自行分析并生成相應的專業(yè)法律答案,而如果遇到復雜或疑難問題,再精準匹配平臺上專業(yè)律師去解決。
盡管已經(jīng)有較為成熟的數(shù)據(jù)庫并進行長期開發(fā),莊大衞稱,目前法小淘就法律問題生成的答案均需人工審核,相當大比例的答案需要經(jīng)過人工修改以后才能被公布。能夠生成具備可操作性的答案也因此成為法小淘今年的工作目標。
“機器人法官”則顯得更加遙遠,鄒劭坤稱,一些人認為,法律邏輯是一個封閉的規(guī)則體系,容易被AI學會——系統(tǒng)只要給出具有法律規(guī)定的大前提,輸入發(fā)生的案件事實,就會得出相應裁判結果。但實際上,無論是民商事領域,還是刑法、行政法領域,某一法律問題的解決可能會存在多種學說、理論和處理結果,在直面具體的實務問題時,會存在千變?nèi)f化的事實要素,存在數(shù)不清的爭議點和模糊地帶,絕非像圍棋和德州撲克的規(guī)則那樣透明、清晰。
更何況,人工智能在法律領域的應用,仍需解決大量實際問題。人工智能行業(yè)從業(yè)者廖一橋向《財經(jīng)》記者介紹,傳統(tǒng)的算法基于決策樹或者概率圖模型,本質(zhì)上是對人的觀念提煉,具有可解釋性。然而,隨著人工智能技術的發(fā)展,一批以深度學習和神經(jīng)網(wǎng)絡為首的黑箱模型逐漸占據(jù)算法主導地位。其特點是有強大的學習和擬合能力,通常情況下效果比傳統(tǒng)算法更好,但同時也是個黑箱——任何人、包括算法的設計者本身,都無法理解它為何作出這樣的決策。
對音樂推薦或者信用評價來說,這些算法或許不無不妥,但是涉及量刑斷案、法庭保釋等司法決定,現(xiàn)有許多“讓AI斷案”的口號無疑充滿風險。
“這相當于人類主動放棄做出判斷的權利,讓充滿隨機性、偶爾會出錯、并對自己的決策過程緘默不言的人工智能,去決定一個人是否有罪。”廖一橋說。
盡管技術上存在數(shù)據(jù)量不足、深度學習模型難以達到等難點,但各類基于AI的系統(tǒng)正在走進司法現(xiàn)實,憂慮也因此出現(xiàn)。美國威斯康星州訴盧米斯一案(Wisconsin v. Loomis)中,盧米斯因回答一系列問題被風險評估工具評級為“高風險”等級,法官判罰其更長的刑期。盡管盧米斯提出上訴,但由于需要保持算法隱匿性,法院最終未對這一工具的算法進行核查,并駁回上訴。
AI作出的黑箱決策也可能給司法鑒定帶來難點。許曉東的建議是,在決策層面要求決策的數(shù)據(jù)都進行長期備份,以便日后發(fā)生糾紛后,鑒定人員可以通過溯源數(shù)據(jù)解決爭議。
而即便能夠?qū)Q策機制和原始數(shù)據(jù)進行溯源,能否得出司法鑒定結論并基于此作出法律判斷,也極大考驗著未來的法律從業(yè)者。
“突破法律智能研發(fā)的困難需要大量的法律行業(yè)專家和計算機算法專家,甚至非常可能是需要培養(yǎng)法律—算法的跨學科專家。”鄒劭坤說。