大數(shù)據(jù)正使法律變得前所未有的強(qiáng)大,在當(dāng)今數(shù)字時(shí)代,大數(shù)據(jù)極其重要,尤其對(duì)律師事務(wù)所而言,法律業(yè)務(wù)也許最終會(huì)靠數(shù)據(jù)驅(qū)動(dòng),那時(shí)我們可以通過一名律師從成千上萬潛在相關(guān)的案件中篩選數(shù)據(jù)的能力,判斷他或她是否是一名好的律師。 隨著海量數(shù)據(jù)的獲得,分析正變得更加重要。對(duì)法律信息進(jìn)行驗(yàn)證、組織甚至使法律信息可視化的新工具正在幫助法律工作者掌握海量法院信息,由于存儲(chǔ)變得更加便宜且處理器變得更加快速,這些工具中內(nèi)置的智能很可能成為未來數(shù)字法律搜索的關(guān)鍵區(qū)別。
文章一:大數(shù)據(jù)時(shí)代律師行業(yè)的三大變革 作者:中關(guān)村在線 面對(duì)新技術(shù),法律專業(yè)人士通常是最保守的人群之一,但大數(shù)據(jù)時(shí)代,律師和律師事務(wù)所要想脫穎而出,卓爾不群,盡快采用大數(shù)據(jù)技術(shù)是不二之選。
2008年金融危機(jī)以來,律師行業(yè)經(jīng)歷了長期的低潮,越來越多的企業(yè)客戶無法負(fù)擔(dān)高昂的律師費(fèi)用,導(dǎo)致律所裁員不斷,規(guī)模日漸萎縮。而那些行業(yè)領(lǐng)先的律所開始推崇“精益企業(yè)”,收費(fèi)模式也從過去的固定費(fèi)率調(diào)整為按需服務(wù)。
但是“精益律所”并非根本的解決方案,律師事務(wù)所還必須借助大數(shù)據(jù)大幅降低信息處理成本,提高數(shù)字競爭力。近日GigaOM專欄作者DerrickHarris撰文指出,律師事務(wù)所基于大數(shù)據(jù)進(jìn)行流程優(yōu)化時(shí),需要重點(diǎn)考慮三個(gè)問題。
一、自動(dòng)化造就“火眼金睛” 文檔檢索可能是大數(shù)據(jù)對(duì)法律工作影響最大的領(lǐng)域。律所通常存儲(chǔ)海量的非結(jié)構(gòu)化電子文檔,包括電子郵件、Office文檔、PDF文檔等等,從數(shù)以TB計(jì)的數(shù)據(jù)中檢索案件相關(guān)文檔簡直就是律師的噩夢,費(fèi)時(shí)、費(fèi)力而且準(zhǔn)確性差。通過大數(shù)據(jù)智能分析軟件,律所能夠大大提高文檔檢索效率。例如大數(shù)據(jù)創(chuàng)業(yè)公司Recommind開發(fā)的大數(shù)據(jù)軟件能通過機(jī)器學(xué)習(xí)算法進(jìn)行“預(yù)測編碼”,大大提高法律文檔的檢索效率。另外一家值得關(guān)注的企業(yè)—PureDiscovery的語義分析技術(shù)也能大幅提高文檔檢索效率。
值得注意的是Recommind還在不斷開發(fā)新的產(chǎn)品Hypergraph(超級(jí)圖譜),例如幫助律師發(fā)現(xiàn)人、話題、時(shí)間線、非結(jié)構(gòu)化數(shù)據(jù)之間關(guān)聯(lián)關(guān)系的功能(編者按:類似圖譜分析)。在這個(gè)領(lǐng)域Recommind面對(duì)的競爭對(duì)手包括Zylab、EMC和IBM。
二、一切皆可數(shù)字化 案件訴訟中會(huì)產(chǎn)生大量文檔,而這些文檔“蘊(yùn)藏”的數(shù)據(jù)對(duì)后來的案件辯護(hù)和審理則具有很高的參考價(jià)值。
大數(shù)據(jù)創(chuàng)業(yè)公司Lex Machina 的目標(biāo)客戶是知識(shí)產(chǎn)權(quán)律師,為他們提供決策支撐數(shù)據(jù)統(tǒng)計(jì)服務(wù)。 Lex machina將很多過去的較為模糊的定性數(shù)據(jù)都給量化了,例如“這位法官對(duì)被告很不利”、“這種索賠的案件通常都能贏”或“這位律師對(duì)此類技術(shù)的經(jīng)驗(yàn)值最高”等。Lex Machina的數(shù)據(jù)分析的數(shù)據(jù)源主要來自公開的PACER(聯(lián)邦法庭數(shù)據(jù)庫),PACER的數(shù)據(jù)一直在那,但是LexMachina是第一家通過機(jī)器學(xué)習(xí)和自然語言處理等技術(shù)從中“淘寶”的公司。
值得注意的是,LexMachina的前身是一個(gè)非盈利項(xiàng)目—斯坦福知識(shí)產(chǎn)權(quán)法律結(jié)算中心,公司還招募到了斯坦福大學(xué)的機(jī)器學(xué)習(xí)和自然語言處理專家Andrew Ng和ChristopherManning。IEEE Spectrum上有一篇對(duì)LexMachina的報(bào)道非常精彩。
三、大數(shù)據(jù)應(yīng)用的自助與創(chuàng)新 與其遙遙無期地坐等大數(shù)據(jù)廠商開發(fā)好用的律師工具,律師們需要自己動(dòng)手,創(chuàng)造性地利用各種現(xiàn)成的大數(shù)據(jù)工具和數(shù)據(jù)源。例如律師可以使用類似ScraperWiki這樣的工具分析證人的Twitter聯(lián)系人網(wǎng)絡(luò)和活動(dòng)記錄。 律師還可以使用類似etcML這樣的免費(fèi)工具(對(duì)應(yīng)的付費(fèi)服務(wù)如AlchemyAPI)分析各種文本,包括推文和電子郵件,來發(fā)現(xiàn)關(guān)鍵觀念或進(jìn)行傾向性判斷。零用import.io這樣的工具從網(wǎng)站抽取數(shù)據(jù)(例如房產(chǎn)價(jià)格歷史數(shù)據(jù)),并制作成圖表。 另外,律師還應(yīng)當(dāng)學(xué)習(xí)掌握目前比較流行的一些數(shù)據(jù)可視化工具。
文章二:機(jī)器人會(huì)偷走你的飯碗嗎——律師篇 譯者:丫丫丫 過去幾年,法律行業(yè)見證了科技創(chuàng)新的飛速發(fā)展,這一切都得益于計(jì)算機(jī)轉(zhuǎn)譯和理解書面文件的能力的增長。現(xiàn)在許多律師事務(wù)所使用“電子取證”工具來從大量證據(jù)中搜尋感興趣的事實(shí)和數(shù)字。事務(wù)所還擁有可以起草法律文件的軟件程序,耗時(shí)僅為人類的幾分之一。這種自動(dòng)化技術(shù)將把法律服務(wù)帶到廣大群眾中去。 設(shè)想一下你現(xiàn)在正面臨一場訴訟。你新開的一家公司創(chuàng)造了一個(gè)十分受歡迎的小程序,而你的首要競爭對(duì)手“微小軟”國際公司正對(duì)你提起專利侵權(quán)訴訟。如果“微小軟”公司獲勝,那么你將要賠償數(shù)千萬美元。 于是你向公司內(nèi)部的律師咨詢,他推薦你雇傭一位闊佬有限責(zé)任合伙公司的專利專家。第二天,一群闊佬公司的律師浩浩蕩蕩進(jìn)入你的公司,把你的所有選項(xiàng)一一列出。與“微小軟”公司官司的辯護(hù)費(fèi)用不菲——這還沒算給案子指派的律師的計(jì)時(shí)收費(fèi),你還需要雇傭?qū)<易C人和陪審團(tuán)指定的專家,并支付他們的差旅費(fèi)和訴訟費(fèi)。總的算起來你需要約500萬美元,但闊佬公司長老級(jí)別的資深合伙人錢袋先生向你保證說花這筆錢是值得的——他處理過很多這種案件,他一邊說一邊向你眨眼睛,他的直覺告訴他他會(huì)獲勝。
你的另一個(gè)選擇是和“微小軟”公司庭外和解。你需要支付1000萬美元許可費(fèi),這筆錢不算少,但對(duì)你公司來說還是拿得出的——然后你可以繼續(xù)做你的生意。 你會(huì)怎么辦? 做出一個(gè)抉擇并不容易。在這個(gè)公司時(shí)代,法律業(yè)是少數(shù)幾個(gè)主要依賴人類經(jīng)驗(yàn)的地帶之一。任何人在卷入一個(gè)標(biāo)的額數(shù)百萬美元的案件前都會(huì)問這么幾個(gè)基本問題——我獲勝的幾率有多大?我的律師有多棒?我該和解嗎?——這些問題都沒有一個(gè)確定的回答。“法律界人士們都有一個(gè)文化傳統(tǒng)。”密歇根州立大學(xué)法學(xué)院助理教授丹尼爾·卡茨(Daniel Katz)說道,他是致力于將經(jīng)驗(yàn)主義和人工智能引入法律的先鋒法學(xué)研究者之一。“人類有很多想當(dāng)然的事情,人們傾向于認(rèn)為法律知識(shí)只適用于人類,而數(shù)據(jù)、計(jì)算機(jī)和自動(dòng)化設(shè)備則不適合于此。” 卡茨正在研究他的“量化法律預(yù)測”。
在美國,每年都有成千上萬起專利案件被記錄在案。因而很有可能“微小軟”公司起訴你的案子和一大堆其他案件有著相似之處。如果你能夠仔細(xì)分析“微小軟”公司訴訟請(qǐng)求中的關(guān)鍵特征,然后再瞧瞧這許許多多具有可比性的案件是如何進(jìn)展的,那么會(huì)怎樣?“律師們就可以這樣對(duì)客戶們說,‘我覺得你有這么點(diǎn)勝率——而這是計(jì)算機(jī)基于一萬件類似案件推斷出來的勝率。’”卡茨解釋道。 如今沒有一臺(tái)機(jī)器能做到這點(diǎn),但將來會(huì)有。在上一章,我仔細(xì)審視了一種正蠶食著新聞業(yè)的技術(shù)——計(jì)算機(jī)在運(yùn)用語言上愈發(fā)嫻熟,它們已經(jīng)能完全靠自己寫故事。而記者的活計(jì)簡直是小菜一碟;如果你想從事一個(gè)十分依賴于語言的工作,那么財(cái)大氣粗的法律界可是個(gè)好去處。 在過去的幾年中,法律行業(yè)見證了科技創(chuàng)新的飛速發(fā)展,這一切都得益于計(jì)算機(jī)轉(zhuǎn)譯和理解書面文件的能力的增長。現(xiàn)在許多律師事務(wù)所使用“電子取證”工具來從大量證據(jù)中搜尋感興趣的事實(shí)和數(shù)字。事務(wù)所還擁有可以起草法律文件的軟件程序,耗時(shí)僅為人類的幾分之一。一些馬上就要誕生的服務(wù)將能做更多的事——比如說商議合同條款,或者判斷你是否該起訴。
這種自動(dòng)化技術(shù)將把法律服務(wù)帶到廣大群眾中去。許多本應(yīng)該雇用一名辯護(hù)律師來處理商務(wù)事宜或個(gè)人糾紛的人卻承擔(dān)不起這筆費(fèi)用。當(dāng)你想和你的抵押放貸者作斗爭、為創(chuàng)辦一家小公司而起草合同或想要靠打官司贏得孩子的撫養(yǎng)費(fèi)時(shí),就可以依靠計(jì)算機(jī)軟件。 雖然法律自動(dòng)化對(duì)那些付不起錢請(qǐng)律師的人來說是一個(gè)福利,但這對(duì)于律師來說是個(gè)壞消息。律師行業(yè)現(xiàn)在本來就不景氣,上法學(xué)院也不再是通向富翁之路的康莊大道。因?yàn)檐浖拇嬖谑沟酶俚穆蓭熌茏龈嗟墓ぷ鳎敲磳?duì)律師的價(jià)格和需求必然隨之下降。 “在我住的伊利諾斯州,你可以看到大片的閑置土地——因?yàn)槟悴辉傩枰褚郧澳菢庸腿肆ΩN玉米和大豆。”伊利諾斯大學(xué)法學(xué)院教授拉里·利博斯坦(Larry Ribstein)說道,他寫了好幾篇關(guān)于法律界信息科技革命的論文。“我現(xiàn)在看到這片大豆田,就會(huì)聯(lián)想到律師。”
在我所寫的關(guān)于機(jī)器人和醫(yī)生的文章中,我主張初級(jí)護(hù)理醫(yī)師這個(gè)職業(yè)可能在機(jī)器人入侵中幸存下來,因?yàn)樗麄兊穆殬I(yè)靠的是必不可少的人類技能,例如引導(dǎo)面對(duì)面的談話之類的能力。乍一看,法律行業(yè)看上去與之相似:法律由人類政客制定,由人類當(dāng)局施行。當(dāng)發(fā)生爭論時(shí),由人類法官和陪審團(tuán)來裁決。法律世界的方方面面——從牽涉到合同和訴訟的專業(yè)語言,到復(fù)雜的分析推論,還有對(duì)法庭書記員和法官們爛熟于心的判例的信賴——都來自于我們稱之為“律師”的那些怪物的前額葉。
如果你去看看大多數(shù)律師每天干的那些活,你會(huì)發(fā)現(xiàn)其中有許多部分都可以由機(jī)器來做。語言、復(fù)雜邏輯的處理,對(duì)涉及多變量情形的預(yù)測——計(jì)算機(jī)在這些事上可拿手多了。 想想法律工作中最死板的那部分:起草商業(yè)合同。在一名律師的職業(yè)生涯中,他也許要起草數(shù)以千計(jì)份合同,其中的許多都包含著大量重復(fù)的內(nèi)容。現(xiàn)在,幾家法律科技公司寫出了可以自動(dòng)生成這些文檔的程序。這些軟件的工作原理很像TurboTax報(bào)稅軟件,問你一系列的問題,之后運(yùn)用分支邏輯深入到特定領(lǐng)域。馬特·凱斯納(Matt Kesner)是硅谷一家具有開創(chuàng)性意義的法律事務(wù)所——芬維克-韋斯特(Fenwick & West)事務(wù)所的首席信息官,他告訴我文檔生成程序幫客戶節(jié)省了時(shí)間和金錢。去年,該律師事務(wù)所研發(fā)了一套可以自動(dòng)產(chǎn)生合并案所需文檔的系統(tǒng)。“它將我們以前平均要花20到40小時(shí)計(jì)費(fèi)時(shí)間的工作減少到了幾小時(shí),”凱斯納說道,“就算那些需要很多文檔的案子,我們也能把起草檔案的時(shí)間從幾天乃至幾周縮減到幾小時(shí)。” 電子取證軟件的意義也是革命性的。這些系統(tǒng)可以挖掘數(shù)量巨大的材料(例如一樁民事訴訟中的所有電子郵件往來),從中找出哪怕是一丁點(diǎn)的證據(jù)。最簡單的軟件只是搜索特定的關(guān)鍵詞,但是更復(fù)雜的系統(tǒng)可以檢測那些律師也許會(huì)感興趣的地方。曾經(jīng)新手律師頭一年做副手時(shí)整天都在干這活;現(xiàn)在計(jì)算機(jī)做得更快,成本更低,卻和人類做得一樣好。
現(xiàn)在,人類律師有一樣優(yōu)勢:法律界對(duì)自動(dòng)化一直抱有懷疑,而且它在某些方面完全不適用。為了建立他的法律預(yù)測系統(tǒng),丹尼爾·卡茨需要大量的法律文件。但是這樣的數(shù)據(jù)庫并不容易得到。法庭會(huì)發(fā)布書面判決,但是其它資料——比如立案書和動(dòng)議——都保存在諸如聯(lián)邦法院的法院電子記錄公眾訪問系統(tǒng)(PACER)這樣的數(shù)據(jù)庫中,想要瀏覽就得交費(fèi)。直到這些信息更容易獲取之前,人類律師還能再分杯羹。 但就像規(guī)定和條例不會(huì)永遠(yuǎn)保護(hù)人類藥劑師一樣,律師在今天這些尚有瑕疵的數(shù)據(jù)庫和軟件的壓力之下也不應(yīng)感到有多么安全。
卡茨和其它研究者正在研究提取和解讀歷史資料的方法——他們建立了一個(gè)名為RECAP的項(xiàng)目,其目標(biāo)是建成一個(gè)PACER的免費(fèi)鏡像。在法律的某些特定領(lǐng)域,數(shù)據(jù)分析已經(jīng)廣泛應(yīng)用。2008年,斯坦福大學(xué)的一組律師和技術(shù)人員建立了知識(shí)產(chǎn)權(quán)訴訟信息交換中心(Intellectual Property Litigation Clearinghouse),一項(xiàng)追蹤了10萬多件專利與商標(biāo)訴訟案的項(xiàng)目。斯坦福大學(xué)去年將它分拆開來,建立了獨(dú)立公司“法律機(jī)器”(Lex Machina),該數(shù)據(jù)庫是目前為止對(duì)專利權(quán)案件最全面的匯總,并且已經(jīng)幫助推翻了一些專利法領(lǐng)域的基本信條。多年來,專利法律師們相信加利福尼亞州北部地區(qū)的法院更傾向于被告,而德克薩斯州東部地區(qū)則更偏愛原告,這種想法讓他們習(xí)慣了挑選對(duì)自己有利的法院進(jìn)行審理。“但是當(dāng)我們查閱加州北部法院記錄時(shí),發(fā)現(xiàn)原告獲勝的時(shí)候更多——完全和我們已知的常識(shí)相反,”法律機(jī)器的CEO約書亞·沃克(JoshuaWalker)說道。
像這樣的故事——數(shù)據(jù)分析顯示出人類直覺錯(cuò)誤的例子——表現(xiàn)出了計(jì)算機(jī)分析的威力。“法律機(jī)器”項(xiàng)目尚不成熟,現(xiàn)在還沒人用數(shù)據(jù)庫來預(yù)測某個(gè)特定的專利案的結(jié)果。但你仍可以看出這樣一套系統(tǒng)在你和微小軟的訴訟中會(huì)制造多大的便利。至少,你可以用它來挑選你的律師,并決定是否和解。 沃克認(rèn)為像“法律機(jī)器”這樣的事物是設(shè)計(jì)來補(bǔ)充人類的智慧,而不是取代人類的。他說,隨著人手越來越多,這個(gè)數(shù)據(jù)庫會(huì)讓律師對(duì)自己的工作更在行。這可能是真的,但是,同樣毋庸置疑的是,這些系統(tǒng)可以系統(tǒng)地幫助客戶決定該不該起訴,以及請(qǐng)哪家法律機(jī)構(gòu),還有在哪提交案件,這將減少律師的用途。我交談過的所有法律研究者都沒反對(duì)過這點(diǎn),但有些人說從長遠(yuǎn)看來,自動(dòng)化可以讓當(dāng)律師更有趣。大部分計(jì)算機(jī)能做的事都是律師痛恨做的。就像丹尼爾·卡茨所見,律師們可以將這個(gè)職業(yè)中最糟的那部分外包給機(jī)器,這樣他們就可以用更多的時(shí)間來處理客戶關(guān)系,并且確保計(jì)算機(jī)干了該干的活。
“你得讓這條虛擬的流水線動(dòng)起來——你就是揮舞著指揮棒的指揮大師,指揮著整個(gè)流程運(yùn)轉(zhuǎn),”卡茨說。自動(dòng)化不僅可以讓律師們擺脫苦差事,還可以讓他們能為更多客戶服務(wù)。還有,以前你只能為幾個(gè)花了大價(jià)錢的客戶服務(wù),而現(xiàn)在你可以通過機(jī)器服務(wù)成千上萬的人,幫助那些現(xiàn)在無法獲得法律服務(wù)的人。 如果自動(dòng)化能花更少的錢,給更多的人帶來法律服務(wù),同時(shí)還能精減人類律師隊(duì)伍,我覺得大多數(shù)讀者都會(huì)認(rèn)為這是一個(gè)多贏的選擇。而從長遠(yuǎn)來看,這很可能實(shí)現(xiàn)。問題在于,這一步可能十分艱難——多家事務(wù)所會(huì)倒閉,一大群菜鳥律師會(huì)找不到工作,一個(gè)龐大產(chǎn)業(yè)的經(jīng)濟(jì)前景就此衰敗。 但是,就我現(xiàn)在寫到的所有職業(yè)而言,法律業(yè)的前景看上去其實(shí)是相對(duì)最光明的。的確,律師們會(huì)吃點(diǎn)苦頭,但是我們剩下這些人會(huì)從中獲益。“法律的存在并不是為律師提供飯碗的,”卡茨說道,“這不是它的社會(huì)功能。它的存在是為人們解決問題的——而如果我們可以用更少的律師服務(wù)更多的人,我不認(rèn)為這是一條不合理的路。” 在接下來我要解釋的是,我發(fā)現(xiàn)在科學(xué)界也有相似的趨勢。也許不久以后計(jì)算機(jī)就會(huì)揭開一些自然界的基本奧秘。它們也許在逐步取代人類,我們是否應(yīng)該小心這點(diǎn)呢?