為了在100多萬份合同中找到所需的具體信息,埃森哲轉(zhuǎn)向了自然語言處理和人工智能,并在此過程中推出了一個(gè)法律分析中心。
專注于文本文檔的組織在簡(jiǎn)化業(yè)務(wù)流程方面有了一個(gè)新的盟友。自然語言處理(Natural language processing)是專注于人機(jī)交流的一個(gè)人工智能(AI)分支,它正在幫助埃森哲(Accenture)等公司將基于文本的非結(jié)構(gòu)化信息帶入機(jī)器學(xué)習(xí)時(shí)代,以便呈現(xiàn)高價(jià)值的信息,并削減成本。
埃森哲的記錄系統(tǒng)中有100多萬份合同,每月還會(huì)新增數(shù)千份合同。由于繁瑣而昂貴的流程限制了詳細(xì)的跨文檔的搜索功能,埃森哲這個(gè)約有2,800名專業(yè)人士的法律機(jī)構(gòu)已經(jīng)很難在合同中找到所需的具體信息了。
“如果我們遇到了在全球范圍內(nèi)發(fā)生的特定事件,例如,我們?cè)跉J奈發(fā)生的洪災(zāi),又或者是發(fā)生了某些超出我們控制范圍的事件,我們多年來一直需要通過手工地方式來做這些事情,以了解我們的客戶或我們的合同義務(wù)是什么。”這家全球?qū)I(yè)服務(wù)提供商的運(yùn)營,企業(yè)分析和數(shù)字化業(yè)務(wù)轉(zhuǎn)型全球總經(jīng)理Mike Maresca說。
因此,該公司的內(nèi)部IT企業(yè)洞察團(tuán)隊(duì)開始利用NLP和AI來幫助提高其合同記錄系統(tǒng)的可搜索性,“以便當(dāng)我們需要以某種方式做出響應(yīng)時(shí),例如,在欽奈洪災(zāi)的情況下,我們可以查看我們的合同來了解收入將受到多大的影響。”Maresca說。
埃森哲的法律智能合同探索(ALICE)項(xiàng)目啟動(dòng)時(shí)考慮到了兩方面的需求。首先,團(tuán)隊(duì)需要幫助法律組織在公司的MMR系統(tǒng)中執(zhí)行超過百萬份合同的常規(guī)文本搜索。其次,它需要被允許搜索合同條款。
“我們有一群數(shù)據(jù)科學(xué)家,他們建立了分析解決方案的模型,這些解決方案可以對(duì)大量合同進(jìn)行索引,并構(gòu)建特定的分析算法來提取條款和條件。”Maresca說。
這不是一件容易的事情,因?yàn)榘I艿臍v史合同幾乎沒有任何的標(biāo)記條款,這意味著團(tuán)隊(duì)無法為項(xiàng)目建立和評(píng)估一個(gè)分類模型。它正在處理一個(gè)不可見的文檔集合,必須確定如何在沒有標(biāo)記數(shù)據(jù)的情況下開發(fā)條款識(shí)別組件。
更有挑戰(zhàn)的是,埃森哲的許多合同都是基于客戶文件的,不同的客戶會(huì)以不同的格式列出他們的條款和條件。這意味著團(tuán)隊(duì)不能應(yīng)用模板方法來確定條款--包括不可抗力、責(zé)任、數(shù)據(jù)隱私等等。合同還不一定會(huì)直接引用子句,因此解決方案還需要找到能夠識(shí)別子句存在的相關(guān)關(guān)鍵字。
自然語言處理的能力
為了解決這個(gè)問題,團(tuán)隊(duì)轉(zhuǎn)向了“"word embedding”,這是一種基于語義相似性的NLP方法,可以促進(jìn)詞之間的比較。該模型可以從合同中提取出一個(gè)關(guān)鍵字列表及其相關(guān)性得分,從而允許子句提取解決方案計(jì)算一個(gè)相似度得分,該得分將指示文檔中每個(gè)段落與特定子句類型的相關(guān)性,Maresca說。
埃森哲的word- embedded模型將逐段檢查合同文檔,尋找關(guān)鍵字以確定該段落是否與特定的條款相關(guān)。例如,“水災(zāi)”、“地震”或“災(zāi)害”等詞通常會(huì)與“不可抗力”一詞連用。
“這些分析允許我們搜索關(guān)鍵的術(shù)語、條件、特定條款、法律條款,并從英語部分開始。”Maresca說。“我們一直在增強(qiáng)我們的翻譯能力。”
執(zhí)行領(lǐng)導(dǎo)層會(huì)通過圍繞業(yè)務(wù)連續(xù)性的特定用例來將項(xiàng)目提交給IT部門,法律組織則是解決方案的業(yè)務(wù)所有者。
Maresca的團(tuán)隊(duì)用了六個(gè)月的時(shí)間,將其從概念性的想法變成了一系列sprint的試點(diǎn)項(xiàng)目。該團(tuán)隊(duì)與不同的埃森哲法律用戶組測(cè)試了該試點(diǎn)項(xiàng)目,并利用測(cè)試結(jié)果構(gòu)建了一個(gè)最低可行的項(xiàng)目,然后將該項(xiàng)目交給一個(gè)解決方案交付團(tuán)隊(duì)進(jìn)行企業(yè)規(guī)模的全面生產(chǎn)。8個(gè)月后,它投入了使用。
啟動(dòng)法律分析
Maresca指出,內(nèi)部的IT Enterprise Insight Studio、法律組織和IT開發(fā)團(tuán)隊(duì)之間的強(qiáng)大協(xié)作是將項(xiàng)目從原型開發(fā)部署到生產(chǎn)的關(guān)鍵。其中,MMR團(tuán)隊(duì)中的數(shù)據(jù)專家是理解元數(shù)據(jù)結(jié)構(gòu)以及如何將元數(shù)據(jù)鏈接到合同文本的關(guān)鍵。法律專家?guī)椭鷺?gòu)建了初始條款提取組件。開發(fā)團(tuán)隊(duì)則包括了數(shù)據(jù)科學(xué)家、UI/UX工程師、軟件工程師和功能架構(gòu)師。
如今,為埃森哲在IT領(lǐng)域獲得CIO 100獎(jiǎng)項(xiàng)的ALICE已全面投入了使用,并提高了埃森哲識(shí)別和理解風(fēng)險(xiǎn)的能力。Maresca表示,這大大減少了律師為獲取具體信息而手工閱讀合同的時(shí)間。
“然后它也被擴(kuò)展到了其他的有價(jià)值的機(jī)會(huì)上面,比如類似‘如果……會(huì)怎樣?’的場(chǎng)景,”Maresca說。“我們會(huì)問,我們?cè)?jīng)以這樣或那樣的方式來構(gòu)建我們的責(zé)任限額嗎?因此,隨著我們對(duì)這一功能的持續(xù)使用,并在看到附加價(jià)值機(jī)會(huì)時(shí)對(duì)其進(jìn)行了擴(kuò)展和增強(qiáng),其用例已經(jīng)大幅增長(zhǎng)了。我們也正在尋找從現(xiàn)有數(shù)據(jù)中獲取價(jià)值的新方法。”
該公司將ALICE視為了其法律分析能力更廣泛的數(shù)字化轉(zhuǎn)型的一部分。在這一愿景之下,ALICE將成為各種法律分析服務(wù)的核心。
版權(quán)聲明:本文為企業(yè)網(wǎng)D1Net編譯,轉(zhuǎn)載需注明出處為:企業(yè)網(wǎng)D1Net,如果不注明出處,企業(yè)網(wǎng)D1Net將保留追究其法律責(zé)任的權(quán)利。