治理预付式消费乱象
42 2025-04-05 08:57:02
[72]从表面来看,似乎司法思维和大众思维的关注点不同,但实则未必:在四川泸州二奶继承案中,也许舆论所代表的大众思维没有关注法律条文所关注的遗嘱形式,但却抓住了问题的关键——遗嘱继承人是否系二奶身份,该身份是否会影响遗嘱的成立?许霆案的定罪量刑问题、银行的地位、与贪腐类判刑相比较的问题,司法思维和大众思维都同等关注。
美国、澳大利亚等国家早已开始利用法律大数据开展警务预测。(二)法律数据的官方性、结构化 相比于商业、社会领域的大数据,法律大数据具有自身的独特性:商业、社会领域的大数据往往是非官方的机构收集并使用的,而法律领域大数据则具有官方化的特征。
同时,大数据与小数据的分析方式在研究模式方面有着共性:都应用数理统计的一般规律,采用统计学的许多方法,尤其是回归分析。例如,法官通过对法律大数据进行分析、评估,建立何种情况下将影响嫌疑人到庭接受审判,何种情况下容易诱发新的犯罪的保释风险预测模型,以此决定嫌疑人能否被保释。大数据资源日渐成为国家与社会的基础性战略资源,推动世界大步迈向大数据时代。作为官方化的数据,公开与不公开往往并存,法律、政治、传统的各种因素都会影响法律和司法数据的公开程度。当然,基于大数据发现新的法律现象、提出新的理论命题,并利用大数据分析技术进行论证,亦是大数据法律研究的应有之义。
白建军:《大数据对法学研究的些许影响》,《中外法学》2015年第1期,第29页以下)。以典型的裁判文书大数据分析为例,由于目前上载的裁判文书达到4000万以上的量级,传统人工下载的方式远远无法满足研究的需要。(二)法律数据的官方性、结构化 相比于商业、社会领域的大数据,法律大数据具有自身的独特性:商业、社会领域的大数据往往是非官方的机构收集并使用的,而法律领域大数据则具有官方化的特征。
二是在大数据研究中适当使用小数据研究的精细化思路与方法,把大数据研究细致化,从而提升大数据法律研究的科学性。因此,大数据法律研究应该回应智慧司法智慧检察的实践需要,并藉此获得更大的致用空间,在理论与实践的互动过程中形成问题意识,推进大数据法律研究的发展。[46]大数据时代的到来,提供了人文社会科学学者大规模协作的可能,[47]也使之成为一种必要。此外,还可运用诸如贝叶斯方法和大数定律等数理统计方法对现有数据进行推断,从而正确识别并验证数据的代表性。
[38]马亮:《实证公共管理研究日趋量化:因应与调适》,《学海》2017年第5期,第199页。一些小数据并不小,特别是一些区域性数据研究涉及的样本可能高达十几万甚至几十万个,其研究方式可能与大数据研究并无二致,甚至有的小数据研究已经在使用复杂的机器学习。
当前,除了对外公布的法律裁判文书,法律决策过程中的关键行为,如形成决策的内部讨论,往往是高度非文字化、非数据化的。【期刊名称】《法学研究》【期刊年份】 2018年 【期号】 4 进入专题: 大数据法律研究 。[23] 尽管如此,大数据法律研究有其独特性,与小数据研究存在诸多不同:(1)研究者的亲历性不同。或许不得不承认,当前对大数据的收集、研究和应用还处在一个比较粗浅的层面上,司法大数据可能具有的超凡价值远远没有得到挖掘。
[17]参见徐明:《大数据时代的隐私危机及其侵权法应对》,《中国法学》2017年第1期,第130页以下。该方式在处理高度规整的文书表达时具有很强的准确性,如从海量文书中自动提取辩护人的数量、身份等表述高度一致的数据。大数据法律研究应当具有什么样的问题意识?当前,一些大数据法律研究缺乏必要的问题意识,主要是描述式研究,沦为调查报告式的数据展示。大数据通常是特定领域的全面数据,具有数量巨大与内容全面之特性。
数据的统计口径往往也不一致,甚至同一主题在不同年份的统计口径也会出现变化,以致数据的连贯性较差。这有助于我们获得裁判文书网以外的丰富材料,进而助力开展更为多元的研究。
目前,中国利用大数据开展的法律实践方兴未艾。[15]参见周强:《最高人民法院关于人民法院全面深化司法改革情况的报告——2017年11月1日在第十二届全国人民代表大会常务委员会第三十次会议上》,《人民法院报》2017年11月2日第1版。
[11]参见前引[7],Lyria Bennett Moses等文,第643页以下。近年来,国内也出现直接利用大量数据展开法学研究的探索,并已经注意到法律大数据所面临的伦理规范等问题。这也会使得某些依靠从裁判文书网获取的文书对特定问题的分析,存在不同程度的数据偏差。大数据的收集和分析往往直接依托于数据技术自动处理、完成。(2)数据产生、收集、分析的快捷性。例如,最高人民法院和最高人民检察院正围绕智慧法院智慧检察,深入推进法院与检察院办案、办公的阳光化、网络化、智能化,人工智能开始运用于司法改革推进和司法建设之中,而司法领域人工智能的运用显然无法离开法律大数据的支撑。
Kevin Miller, Total Surveillance, Big Data, and Predictive Crime Technology: Privacys Perfect Storm,19 Journal of Technology Law Policy 105-146(2014); Neil M. Richards, Jonathan H. King, Big Data Ethics,49 Wake Forest L. Rev.393-432(2014). [12]See Sohayla M. Roudsari, Fourth Amendment Jurisprudence in the Age of Big Data: A Fresh Look at the Penumbers through the Lens of Justice Sotomayors Concurrence in United States v. Jones,9 Federal Courts Law Review 139-174(2016); Ismail Cem Kuru, Your Hard Drive is Almost Full: How Much Data Can the Fourth Amendment Hold,2016 U.of III. J. L. Tech. Poly 89-134(2016). [13]参见卢国强:《北京警方利用大数据预测犯罪趋势》,《科技日报》2014年6月18日第3版。数据的官方化,是法律大数据不同于商业性、社会性数据的特殊之处,这就决定了法律大数据的获取与应用水平在相当程度上取决于法律机构是否充分、及时公开其收集、掌握的法律信息。
但总体而言,目前国内对于法律大数据的实践性运用还相对有限,具体运用并不普遍,在一定程度上呈现出话语热、实践冷的现象:一方面,应用主体范围有限,主要集中在少数司法机关、法律数据公司。在美国,法律大数据被充分运用于犯罪趋势分析、发案情况预测、警力分配以及调查工作重心的确定等。
例如,自首也许在文书中并不会以自首的关键词出现,而是以家属扭送等诸多样态的语词呈现,此时就需要用自然语义识别技术(NLP)。此外,大数据法律研究表面上是围绕数据展开,但由于很多数据其实指涉或反映主体的行为、意识与习惯等,这使得大数据法律研究不可避免地牵涉人的问题,甚至可能会将作为研究对象的人置于相对危险的境地。
实证法律研究 一、大数据法律研究时代的来临 受惠于互联网与大数据技术的迅猛发展,数据正以前所未有的速度巨量生成,海量的数据资源由此产生。如果说基于小数据法律实证研究的理论图景已日渐清晰,那么基于大数据法律实证研究的理论问题似乎未昭未揭。总之,身处大数据时代,我们正无时不刻不受到大数据广泛而深刻的影响。在小数据研究中,这种模式能基本胜任。
当然,研究者也需要注重对技术的深度学习与直接使用,努力做到自己掌握、使用现有技术工具进行数据收集、挖掘与分析。由于小数据的有限性,研究者一般亲自、逐一收集、审阅和分析每一个研究样本,具有很强的亲历性。
其中,全样本是其最显著的特征,全样本数据意指相关的所有数据。[3]参见刘佳奇:《论大数据时代法律实效研究范式之变革》,《湖北社会科学》2015年第7期,第143页。
感谢叶燕杰同学、郭松博士、王禄生博士、刘方权教授、洪凌啸同学、詹小平博士、张潋瀚博士、朱奎彬博士对本文初稿提出的修改意见。[35]然而,在法律大数据的来源上,目前过度依赖官方尤其是法院的主动发布,内容、渠道存在单一性、有限性等问题。
顾理平:《大数据时代公民隐私数据的收集与处置》,《中州学刊》2017年第9期,第161页以下。这类技术在法学领域才刚刚起步,主要出现在大数据与人工智能的司法实践中,还较少被应用于法律大数据的研究中。真正丰富的法律大数据应兼具大数据的自然特征与法律特征,主要由各种法律主体参与生产、制作并发布,具有全样本、即时性、多样化特征。由于人工统计无法完成数据挖掘的任务,因而需要运用正则表达式等数据挖掘方法。
美国、澳大利亚等国家早已开始利用法律大数据开展警务预测。一旦需要进行更多的因果关系或相关性研究,描述性分析则明显力有不逮。
法律大数据研究的核心在于对海量数据的价值挖掘、处理,这就涉及上述数据的获取、清洗与使用。未来的大数据法律研究不仅应思考如何更好地获取法律大数据,还要探讨如何正确认识与适当使用大量数据,更要充分利用统计方法展开大数据法律研究,探讨如何科学使用机器学习等新方式分析法律大数据。
当前这项研究存在若干误识,如将大量数据结构化数据等同于大数据。第三,重视和利用好当下的大量数据,包括区域性的全样本数据。