数据思维流行于法律行业不足一年,相较于BAT三大巨头动辄千万级、亿万级的数量级,法律行业的数据真算不上大数据。以openlaw为例,openlaw收录的案例数据的总量为13028969,如果做具体案例的检索数据量级会更低。不过就数据分析来说,无所谓大数据、小数据,数据的量级应当与分析区域、框架、适用范围相匹配,无须一味追究巨量数据。
从法律数据报告的使用来看,笔者将法律数据报告使用归结为五大场景:
从这五大场景我们来具体分析法律大数据报告,从中寻求制作法律数据报告的一般规律,进而指导我们对法律大数据的运用。
注:样板报告均来自网络公开材料,此处仅做分析引用。
一、整体趋势分析报告
1、大数据分析样板
广东省劳动争议大数据报告
北京高端商事案件大数据报告
湖南高端商事案件大数据报告
2、整体趋势分析报告的基础数据结构设定分析
从这份表单我们可以看出趋势类大数据报告中的几大基础要素:
(1)时间要素(案件数量的年度分布);(2)案由要素,分析案件数量的案由分布,以此确定各类案件占比,找出热点案由,进而做热点案由分析;(3)审级要素,具体统计一二审及再审案件数量,并做案件结果分析,如二审改判率、二审撤销率、再审立案绿;(4)代理情况要素,这类分析要素一般以律师代理、非律师代理两种指标做数据分析。
3、整体趋势分析报告特征
整体趋势分析报告是一种宏观数据分析报告,其提供的是趋势分析。通过对趋势分析,可以根据2/8原则,将工作重点集中在热门要素,从而提升工作有效度。比如时间要素是做案件的时间趋势分析,如图1,通过分析2014年不同月份案件数量分布,可以据此指导律所对全年诉讼工作作出安排。
(图1:节选自湖南高端商事案件报告,湖南人和律师事务所,江帆、黄珍)
二、特定行业分析报告
1、大数据分析样板
P2P行业涉诉大数据报告(宁波)
深圳建筑装饰行业诉讼报告研究
2、特定行业分析报告的基础数据结构设定分析
这两份不同地区、不同行业的法律大数据报告采用的基础数据结构很相似,均包含:涉诉类型分布、诉讼地位分布、审级分布、诉讼案由分布。我们试举一例,从涉诉类型来具体分析:
涉诉类型分析在于分析行业中纠纷的类型分布,确定行业法律业务的着力点:如图2为建筑装饰行业,其涉诉类型中买卖合同纠纷占了很大比重,图3为P2P行业,民间借贷纠纷的占比最大。通过行业涉诉类型分析,可以明确法律业务的着力点,提高法律服务的针对性。
(图2:节选自深圳建筑装饰行业案件数据研究,盈科律师事务所,胡玉芳、王志强)
(图3:节选自P2P行业涉诉大数据报告,浙江京衡(宁波)律师事务所,张豪)
3、特定行业分析报告特征
特定行业分析报告的目的在于做行业本身法律业务类型的分析,所以其基础数据结构会设定在涉诉纠纷类型、诉讼地位分布等要素,通过这些要素进一步梳理出行业潜在的法律风险,并针对这些风险制定应对措施。
三、特定案例分析报告
1、大数据分析样板
商标侵权诉讼案件大数据报告
商业租赁纠纷案件大数据报告
民间借贷案例大数据报告
环境公益诉讼大数据报告
股权纠纷大数据报告
2、特定案例分析报告的基础数据结构设定分析
3、特定案例分析报告的特征
从基础数据结构分析表来看,我们会发现不同类型的案例相同的统计指标很少,这四份分析报告中仅有"同类案件地域分布"、"诉讼主体"在三份报告中体现,其他的统计指标均是依据案例本身的特征来做统计。如:
(图4:节选自商业租赁纠纷案件大数据报告,建纬(深圳)律师事务所,贺倩明 )
图4,为商业租赁纠纷案件大数据统计报告,其在选取统计指标事确定了争议焦点作为其中一个指标,通过统计争议焦点的数量分布,可以明显看出此类案件多数争议焦点为"合同解除纠纷",并进一步围绕"合同解除纠纷"的原因及"合同解除纠纷及其附带纠纷(没收租赁保证金、计收免租期租金等)"的裁判结果。
(图5:节选自民间借贷案例大数据报告,八谦金融事务部)
图5与图4相同,均从案件的特征出发来设计统计指标,民间借贷案件必然涉及借贷利息的诉求,因此分析报告中以"主张利息、全部支持利息、部分支持利息、不支持利息"四个指标对案件数据分布进行统计。
通过以上的分析,我们不难看出制作此类特定案件分析报告没有一个统计的标尺,需要提前了解此类案件涉及的法律、案件主要特征、案件涉及的诉求等因素确定统计指标。如果没有对一类案件清晰的认识,是很难做出有效的大数据分析报告。
四、客户单位分析报告
1、大数据分析样板
中兴通讯数据报告(2010-2014)
阿里巴巴诉讼报告
2、客户单位分析报告的基础数据结构设定分析
3、客户单位分析报告的特征
这两份样板数据均来源于智合.观察,是其对知名网络公司做的数据分析。类似的数据报告还有北京天同律师事务所的《中国建设银行最高人民法院案件数据统计分析报告》。此类客户单位分析报告的缘由一般是应客户要求,对客户做尽职调查所出具的意见类报告,或者作为一种开拓客户的方式,如天同所的统计分析报告。
这类大数据报告制作的重点在于全方位的数量和重点解读,以中兴通讯数据报告为例:
(图6:节选自中兴通讯数据报告,智合研究院,智合新媒体 )
中兴通讯从诉讼类型分析,占比最大的为三类案件,分别是专利案件,占比43.47%;合同纠纷,占比18.84%;劳动争议,占比13.04%。这些数据就可以为中兴公司法务部做业务调整和人员规划作出依据,将更多的精力放在对这三类案件的研究上,并关注这三类案件的法律发展。
五、法律问题研究报告
1、大数据分析样板
中国律师择业和收费报告
法律大数据之外资律所驻华代表机构大揭秘
2014十大法律检索热词
2、法律问题研究报告的基础数据结构设定分析
3、法律问题研究报告的特征
相对于其他四类大数据分析报告,法律问题研究报告更无迹可寻,其原因在于法律问题研究的特殊性。比如《中国律师择业和收费报告》不可能去用地域分布、国别分布的数据统计指标,其必须从分析报告的目的、特征出发去确定数据统计指标。因此在制作这类法律问题研究报告中我们必须牢记从法律问题本身的特征出发去确定数据统计指标,而后在统计指标的指导下去收集材料。当然这类研究报告的数据来源不限于案例,其来源范围比较广泛,需要我们在制作此类报告的时候多加注意。
结语
一份法律数据报告需要经过项目设定、数据采集指标甄选、数据采集、数据整理、数据分析、成果输出六大流程。这篇文章仅仅从数据采集指标角度对数据报告的使用做了初步的分析,至于其他环节的把握有赖于报告制作者结合法律问题和技术方式予以确定。希望本篇对各位制作大数据报告有所裨益。
0 条评论