惟勝會《實現擔保物權特別程序大數據報告》是對2148份裁定書分析后的成果。如此多的裁定書,收集、分類、分析必然是巨大工程量。那么問題來了,有沒有好的方法或工具幫助?
直接進入正題吧,告訴大家由2148份裁定得到的大數據報告是怎么來的。
第一步 數據采集與歸類
在中國裁判文書網采集裁判文書,目前是不能直接進行復制的,即使采取某些技術手段復制了,也需要重新建立文檔進行粘貼、為文檔重命名。可能您覺得沒神馬,但這樣來回重復幾千下還是讓人崩潰呀。(自我反省,我是不是太懶了?)可有什么方法可以簡便快速的搞定裁判文書的采集呢?
1、安裝印象筆記
請保證您的電腦上(不分系統)有印象筆記,紅圈中可愛的小象就是印象筆記了。
2、按照省份新建若干筆記本
對實現擔保物權特別程序的大數據分析,少不了要區分省份進行對比,因此,我以省份為項新建了若干筆記本,這些筆記本又組成一個實現擔保物權的筆記本組。以后我對實現擔保物權采集的全部素材就統統包含在這個筆記本組里了。
3、安裝印象筆記剪藏功能,使之能在瀏覽器上進行裁判文書采集分類
圖片中黃色圈部分就是印象筆記的剪藏功能按鈕了。如圖,我在瀏覽器上將需要收集的裁判文書打開,點擊黃圈部分剪藏功能按鈕,然后就會出現圖右邊印象筆記對話框。確定綠點選定在藍色圈的“網頁正文”選項上,然后按照裁判文書省份選定之前新建的筆記本,最后點擊確認。
這樣,越過了裁判文書網無法復制的障礙,拋棄了重復復制、粘貼、建立文檔等繁雜步驟,每份裁判只需要輕點幾下就乖乖收入到了我的印象筆記實現擔保物權筆記本組中,并且已經按照省份做好了分類。
例如,在安徽省筆記本中,每份裁定書自動成為一條筆記,紅色部分自動統計該筆記本中的筆記條數,說明安徽省共116份裁定文書(幫我省了統計各省案件數量的活)。
自此,裁判文書的收集、分類完成。在有印象筆記軟件的電腦、手機、ipad上,只要我登陸自己的賬戶,就可以查看收集全部裁判文書,隨時隨地工作。
第二步 分項統計及分析
1、分析項信息錄入
本次實現擔保物權大數據報告,我們設定了15個分析項,包括申請人性質、擔保物權類型、審理形式、是否進行財產保全等。這個時候,excel出場了。
如圖黃色部分,我將需要分析的項在excel的第一行列出,并將每個省份作為一個工作表(紅色部分),在excel中錄入分析信息。更好的是,有時候需要直接復制裁判文書內容到excel中,印象筆記完全可以滿足我。注意,分析表中沒有案號一項,我認為案號的錄入也是相當大的工作量(再次自省,是不是太懶了?),那如何解決?
2、不用單獨費力錄入案號,印象筆記來幫忙
如何將excel的每個案件信息與印象筆記中的每份裁判相對應?如果靠excel最左列數字,用數的方法對應印象筆記中的裁判文書順序,第19份還好,第99份呢,第199份呢、甚至第1999份呢?
這個問題,印象筆記目錄功能可以解決。
以廣東省為例,將廣東省筆記本內的筆記全選(快捷鍵:蘋果系統command+A,windows系統下control+A),就會出現右邊紅色部分“創建目錄”,點擊創建目錄。這樣,廣東省的全部裁判文書就按照順序形成如下的目錄筆記。
在這樣的操作下,需要您保證excel分析信息錄入是按照每個筆記本中的每條筆記順序進行的,則excel的行號減1(第一行是分析項名稱)就與目錄中的紅色圈中的數字對應。找到對應的目錄數字后,只需要輕輕一點目錄數字后面綠色部分,印象筆記自動為您跳轉到該條筆記,無需您費力在幾百甚至上千個案例中尋找。
3、篩選器,只看想看到的信息
信息錄入后,要對各項信息進行歸納、分析、統計,篩選器在這個時候堪比貼心小棉襖。如圖紅色部分,對第一行分析項設置數據下的篩選器功能,這樣在分析項中就會出現下拉三角形標志。
如下圖,如果我需要統計該省份采用合議庭進行審理的案件數量,點擊篩選器的下拉三角形,勾選合議,則表中僅出現審理形式為合議庭的案件信息。這樣,分析、統計變得一目了然。
解決了裁判文書采集、歸類,信息錄入及篩選,您的大數據分析準備工作已經基本完畢。接下來,就是利用收集的裁判文書、通過分析項信息的對比、統計,進行成果提煉、分析等工作,最后形成大數據報告。