“计算+法律”的实现困境与理性考量——基于涉诉信访案件全过程推演的应用场景.pdf
2023 年第 2 期 华东政法大学学报 “计算 + 法律”的实现困境与理性考量 ——基于涉诉信访案件全过程推演的应用场景 苏成慧 * 目 次 一、基于计算思维的场景预设:涉诉信访案件全过程智能推演 二、法律思维下的困境与限度:关联诉讼案件智能评查受限 三、 “计算 + 法律”的双向审视:形式理性与实质理性的平衡 四、结语 摘 要 法律与计算的融合以数据为基础,以法律知识体系的数字建构为核心,以算法模型的设 计为关键;法律与计算的冲突以价值考量为评价方式。在涉诉信访案件处置的应用场景下,人工处置 涉诉信访案件思维的流程化以及法律适用的逻辑性、规则性、体系性为涉诉信访案件全过程智能推演 提供可计算的空间。但法律推理和论证过程中存在着诸多形式逻辑以外的主观考量和价值评价因素, 这些因素成为当前智能技术模拟涉诉信访关联诉讼案件评查难以逾越的鸿沟。对信访人“人物画像” 的场景预设因违背比例原则,而不具备法律上的实质正当性。数据安全保障与算法风险的防范是实质 理性下“计算 + 法律”的必然要求。 关键词 司法人工智能 数据安全 算法规制 计算法学 涉诉信访 近年来学界形成以计算为本,基于数字系统建模计算和数理逻辑的“法律 AI”研究进路,力图从 内在视角用逻辑计算和代码程序来表达法律,推进司法过程的智能化。〔1〕既有研究成果大多从理论 * 苏成慧,西南政法大学讲师、西南政法大学总体国家安全观研究院研究人员,法学博士。本文系 2020 年度教育部哲学社会科 学重大攻关项目“人工智能发展中的重大风险防范体系研究” (项目号 20JZD026) 、 2021 年度国家社会科学基金青年项目“信息处理 者的安全保障义务研究” (项目号 21CFX008)及 2018 年度科技部国家重点研发计划项目“多源涉诉信访智能处置技术研究” (项目 号 2018YFC0831800)之子课题四“涉诉信访案件全过程推演技术研究” (项目号 2018YFC0831804)的阶段性研究成果。 〔 1 〕 参见马长山: 《迈向数字社会的法律》 , 法律出版社 2021 年版, 第 26-31 页。 80 苏成慧 “计算 + 法律”的实现困境与理性考量 层面探讨技术原理与法学理论的融合与冲突,话题主要涉及智能司法的辅助裁判模型、法律议论模 〔2〕 偏重于对整体规则和原理的论 型、 人工智能与事实认定、法律知识图谱建构、 智能裁判形成过程等, 述, 鲜有从具体场景视角阐述“计算 + 法律”的实现路径与存在困境。 本文将基于涉诉信访案件处置这一特定应用场景,对实现涉诉信访案件全过程智能推演的技术 原理与办理涉诉信访案件的法律原理之融合展开研究,即基于具体场景,从微观视角揭示智能技术评 查诉讼案件的内在逻辑、作用原理、实现方式等,将“怎样的法律问题是可计算的问题”具体化。以计 算和法律的双向视角阐明“计算 + 法律”在该领域实现的困境、可能实现的程度,并对此作规范性评 价, 有助于为法学与计算机科学的进一步融合研究搭建“桥梁”, 希冀能够为智能技术在司法领域的应 用研究及基于应用的规范研究提供一定的参考价值。 一、基于计算思维的场景预设:涉诉信访案件全过程智能推演 所谓“涉诉信访案件”,是指涉诉信访人对其信访所对应的诉讼案件(以下简称“关联诉讼案件” ) 的诉讼权利已经丧失或者充分行使完毕,即已用尽审判监督程序等司法救济途径,仍对关联诉讼案件 的审判程序或裁判结果不满,只能通过信访的方式表达诉求的案件。其信访的事项包括与关联诉讼 案件审理相关的实体问题、审判程序问题及审判案件法官的作风问题等。因此,法院信访部门工作 人员处理涉诉信访案件首先要查明与信访对应的诉讼案件是否“确有问题” ,如果该诉讼案件“没有 问题” ,则继续查明影响信访人信访的其他原因(主要是信访人自身原因) ,以便采取针对性处置措施。 对信访原因的查明需要回溯“关联诉讼案件从一审立案到案件审结,再到信访人信访”全过程,其中 涉及对关联诉讼案件的评查,以及在关联诉讼案件“没有问题”的情况下查明信访的其他原因。以计 算思维为本的智能技术应用,力图借助逻辑计算、符号程序、数字系统来表达涉诉信访案件全过程推 演的要件体系和思维逻辑,以辅助法院处置涉诉信访案件。 (一)涉诉信访案件人工处置的关键: 信访原因的查明 涉诉信访案件人工处置遵循“了解信访案件基本信息(包括信访人基本信息、信访诉求、关联诉 讼案件信息等)→分析导致信访的原因(主要评查关联诉讼案件是否“确有问题”)→信访行为性质认 定→合理处置信访案件”的流程。其中,准确把握导致信访的原因是处置涉诉信访案件的关键。 引发信访人实施信访行为的具体原因较为多元,可概括为两大类。一是,关联诉讼案件“确有问 题” ,这主要表现在关联诉讼案件之事实认定、法律适用、程序合法性等方面存在问题。其中,事实认 定问题包括遗漏案件事实、事实认定错误等;法律适用存在的问题为法律适用有误;司法程序问题包 括立案判断错误、管辖错误、审判程序不当等。此外,还存在其他问题,比如裁判说理不充分、遗漏或 者超出诉讼请求、再审申请被驳回、裁判不公、未在法定期限内审结、量刑过轻或者过重、执行难等。 二是,信访人自身原因。目前绝大多数涉诉信访的原因来自信访人本身,主要表现为:其一,信访人法 律意识淡薄,信访不信法,认为只有找职位高的领导才能解决问题,并且闹得越凶越能解决问题;其 〔 2 〕 参见高翔: 《人工智能民事司法应用的法律知识图谱建构——以要件事实型民事裁判论为基础》 ,载《法制与社会发展》 2018 年第 6 期, 第 66-80 页; 谢慧: 《“智能 +” 模式下裁判形成的过程分析》 , 载《济南大学学报(社会科学版) 》 , 2019 年第 4 期, 第 43-53 页; 季卫东: 《人工智能时代的法律议论》,载《法学研究》2019 年第 6 期,第 32-49 页;栗峥: 《人工智能与事实认定》 ,载《法学研究》2020 年第 1 期,第 117-133 页;高翔: 《智能司法的辅助决策模型》 ,载《华东政法大学学报》2021 年第 1 期,第 60-75 页;王琦: 《民事诉讼事 实认定的智能化》,载《当代法学》2021 年第 2 期, 第 125-133 页。 81 华东政法大学学报 2023 年第 2 期 二,多数信访人经济上“确有困难”,由于诉讼期待利益的落空,欲通过信访的方式得以解决;其三,部 分信访人存在性格偏执、人格障碍、心理状况不佳等问题,在没有任何证据和合理理由时仍坚持认为 裁判结果不公平。〔3〕 审查信访人信访原因的目的在于明确涉诉信访人的信访诉求合理与否,进而作出有针对性的处 置策略。具体而言,由于信访人的信访诉求针对的是关联诉讼案件的司法程序和裁判结果,故首先应 判断信访人的诉求是否合理(若关联诉讼案件“确有问题”,则属于合理诉求);若信访诉求不合理,则 应根据关联诉讼案件以外的其他信息来确定信访人的信访原因,比如,经济困难、人格偏执、法律意识 淡薄等。在处置涉诉信访案件时,若评查发现关联诉讼案件“确有问题” ,应将该案件报审判委员会, 由审判委员会决定是否启动审判监督程序予以处理; 对于关联诉讼案件“没有问题”的涉诉信访案件, 则由信访部门工作人员结合导致信访的其他原因,对其信访的事项耐心沟通解答,以使其快速息访。 实践中,信访工作人员在对关联诉讼案件评查后,发现绝大多数信访人信访的原因并非关联诉讼案件 “确有问题”, 而是源自关联诉讼案件以外的原因。 (二)智能技术模拟涉诉信访案件全过程智能推演之预设 智能技术的本质在于模拟人类智能, 规则化、 要素化和图谱化是人工智能机器学习的前提。〔4〕在 涉诉信访案件处置的应用场景下,智能技术的研发遵循人工处置涉诉信访案件的思路。涉诉信访案 件全过程智能推演需求的应用场景为:法院信访部门的工作人员将关联诉讼案件基本信息(当事人姓 名、身份证号码、案号)录入系统,系统能够自动对该信访行为定性,并给出与之对应的处置建议以供 参考。其实现方式为:通过评查关联诉讼案件,并结合信访人要素、涉诉信访案件要素评查影响信访 人信访的其他原因,进而对涉诉信访案件进行全过程智能推演,目的在于准确认定该涉诉信访案件的 性质,根据涉诉信访案件性质的判定,系统自动给出对应的处置建议,以供涉诉信访部门工作人员决 策参考。具体而言, 这一应用场景下智能技术系统的实现可预设如下四个步骤。 首先,涉诉信访案件要素集的构建。〔5〕智能技术的核心在于算法,基础在于数据。将涉诉信访案 件的所有信息利用语义识别技术、图片分析技术并结合机器学习的方法解构为计算机能够识别的数 据集,是智能技术模拟人工处理涉诉信访案件的前提。构建涉诉信访案件要素集需以三类数据为基 础,即信访人基本信息数据、关联诉讼案件数据、信访数据。其中,信访人基本信息数据来自与信访人 相关的多源大数据(性格、文化程度、职业、家庭结构、成长背景等) ,关联诉讼案件数据主要来源于该 案件司法审判各个阶段的卷宗材料(案件性质、案由、争议焦点、审判结果、结案方式等),信访数据来 源于法院信访部门登记的信访人信访的基本情况(信访次数、 信访人数、 信访诉求等)。 其次,基于关联诉讼案件要素集实现对关联诉讼案件的智能评查,目的在于明确定位案件处理结 果是否“确有问题” 。对关联诉讼案件的评查是涉诉信访案件处置的核心。如前所述,对关联诉讼案 件智能评查的基础数据主要为该诉讼案件从受理到结案全过程的所有卷宗材料。在将诉讼案件类型 化的基础上,对涉诉信访关联诉讼案件基础数据进行要素解构,并基于法律知识逻辑体系和审判推理 思维设置各要素之间关联关系的算法模型,以此构建关联诉讼案件审理中关于事实认定与法律适用 〔 3 〕 参见李微: 《涉诉信访: 成因及解决》, 中国法制出版社 2009 年版, 第 189-190 页。 〔 4 〕 参见高翔: 《智能司法的辅助决策模型》 , 载《华东政法大学学报》2021 年第 1 期, 第 65 页。 〔 5 〕 所谓涉诉信访案件要素, 是指对应基础数据中影响涉诉信访案件评查的最小颗粒度的实体。 82 苏成慧 “计算 + 法律”的实现困境与理性考量 实现对涉诉信访关联诉讼案件的智能评查。 的知识图谱〔6〕。以知识图谱为案件评查系统的核心, 再次,基于信访人基本信息要素集,实现对信访人的“人物画像” ,目的在于分析其是否存在人格 偏执、精神障碍、经济困难、法律意识淡薄等情形。对信访人的“人物画像”有助于把握非合理诉求下 信访人信访(甚至缠访、闹访)的原因,以便于智能系统给出有针对性的处置建议。其基础数据来源于 与信访人相关的多源大数据,包括关联诉讼案件卷宗材料中能够获取的信访人基本信息数据、相关部 门掌握的关联数据(社保、民生、医疗、教育等)以及一般社会数据(消费数据、 生活数据等)。 最后,整合信访数据集,实现涉诉信访案件全过程智能推演。由于涉诉信访案件处置的核心在于 评查已经审结的关联诉讼案件,因此需对关联诉讼案件全面复盘。即将涉诉信访案件要素按照“关联 诉讼案件的起诉→审理→结案→信访”的全过程在计算机内予以还原,以此实现计算机对关联诉讼案 件当事人从诉讼案件的开端到信访的全过程之“理解”。因此, 需要基于关联诉讼案件评查结果、信访 人“人物画像”结果,并整合信访数据分析结果(分析信访数据的目的在于明确信访人的信访情况,即 是否构成多次信访、缠访、闹访等),通过算法模型准确定位导致涉诉信访人信访的原因,评估信访行 为的性质,并针对具体原因匹配合理的处置建议, 以实现对涉诉信访案件处置的全过程推演。 二、法律思维下的困境与限度:关联诉讼案件智能评查受限 如前所述,对关联诉讼案件的评查是实现涉诉信访案件全过程推演的关键。在具体实践中,关联 诉讼案件智能评查的实现受到五个方面限制,进而影响涉诉信访案件全过程智能推演的实现程度。 (一)多源基础数据难以全面获取 智能推演涉诉信访案件处置的核心在于定位涉诉信访人的信访原因,而实际上每一项可能引发 涉诉信访人信访之原因的技术判定都需要以多源基础数据为支撑。如前所述,涉诉信访案件要素集 的构建需整合信访人基本信息数据、关联诉讼案件数据、信访数据等多源基础数据。但目前我国数据 流通共享的机制尚未健全, “数据孤岛”现象尤为明显,使得该场景下多源数据的整合受限。具体表 现在以下两个方面。 其一,关联诉讼案件数据使用的实时性受限。实践中,多数涉诉信访人一般选择其居住地的就近 法院的信访部门多次信访。若其信访的关联诉讼案件最终结案的法院为信访人去信访的法院的上级 法院,则需下级法院申请查看上级法院审理的关联诉讼案件的司法数据。由于关联诉讼案件数据由 各法院独立存储,下级法院查看和使用上级法院的数据需经过一定期限的申请和审批程序,较大程度 影响数据分析的实时性。此外,对刑事诉讼案件、行政诉讼案件的全面评查,需要接入公安机关侦查、 检察院审查起诉、行政机关实施行政行为的相关基础数据,这些数据的流通同样受到申请和审批程序 的时间限制, 并且须在厘清可流通数据范围的前提下才能在特定场景依法应用。 其二,整合对信访人“人物画像”所需的相关数据存在较大困难,导致评价信访人是否因关联诉 讼案件以外的原因而信访的基础数据不具备。实践中,多数信访人信访的原因大多在于法律意识淡 〔6〕 所谓知识图谱,是指用图模型来描述知识和建模世界万物之间的关联关系的技术方法。知识图谱由节点和边组成,节点可 以是实体或抽象概念,边可以是实体的属性或实体之间的关系。参见王昊奋等主编: 《知识图谱:方法、实践与应用》 ,电子工业出版社 2019 年版,第 1 页。目前知识图谱常被泛指各大规模的知识库,在图谱中每一个节点(也被称为“实体”或者“概念” ) ,是对客观世界 的知识映射,构成知识库的“知识点”,实体和概念之间的语义关系构成知识点之间的逻辑关系。参见华宇元典法律人工智能研究院 编: 《让法律人读懂人工智能》, 法律出版社 2018 年版, 第 22 页。 83 华东政法大学学报 2023 年第 2 期 薄(信访不信法)、人格偏执、经济困难等。智能技术欲实现对这些原因的准确评查,一方面,需要相关 政府部门存储的有关信访人社保、民生、受教育程度等基本信息。由于政府数据共享机制尚未健全, 这些数据的整合利用还存在较大的困境。另一方面,由于医疗数据等相关数据的流通涉及个人信息 保护、隐私保护、数据安全等问题,且目前关于医疗数据的使用规则尚未健全,使得对涉诉信访人基于 医疗数据评价其是否存在人格偏执、精神障碍等原因的基础数据缺乏。此外,以互联网平台为主的信 息处理者处理的个人数据之使用规则尚未完善, 导致无法获取信访人消费数据、 日常行为数据。 (二)关联诉讼案件之要件解构体系庞杂 涉诉信访关联诉讼案件智能评查技术的实现遵循“案件类型化—构成要件解构—基于构成要件 的要素提取—基于法律知识体系和逻辑推理思维构建要素之间的关联关系”的基本思路。从涉诉信 访关联诉讼案件中抽取要素是构建涉诉信访关联诉讼案件评查知识图谱的关键。对诉讼案件分类越 细化, 要件解构越具体、 全面,越有利于实现案件要素提取的完整性、 精确性。 以案件类型化为核心的法律概念体系化,是关联诉讼案件要件解构的核心。首先要由法律专家 以案由为标准尽可能细化案件类型。比如, 按照“民事案件—合同纠纷—借款合同纠纷—保证合同纠 纷—连带保证责任合同纠纷”的形式将案件类型细化到可进行要件解构的层次。其次分析和解构每 一类细化案件的构成要件,即从事实认定、法律适用、裁判推理等方面解构案件的构成要件。比如,在 连带保证责任合同纠纷中需要从当事人提交的多项证据中解构出能够认定为连带保证责任法律关系 之案件事实的构成要件,包括债权人、债务人、保证人、借款合同、保证合同、连带保证责任、借款合同 期限、保证期间等法律概念体系中的最小单位,这些最为基础的概念最小单位能够为技术人员标注关 联诉讼案件基础数据提供方向。通过标注,才能设置提取基于要件解构的案件要素的算法模型,实现 静态的法律知识体系在对应案件中的数字化表达。在此基础上,需要法律专家基于法律知识体系及 裁判推理思维,构建各项构成要件之间的关联关系,并由技术人员将构成要件之间的关联关系以技术 语言对应到提取的各项要素中,以此实现对某一类具体案件评查的数字化表达。 因此,要实现法律概念与具体案件中相关实体要素的精确对应,需要通过专家经验和机器学习, 对概念体系实现不同层级的要件解构,直至能够将法律概念对应于关联诉讼案件基础数据的最小实 体要素项。由于案件类型较为多元,且每一类案件均需要从事实认定、法律适用、裁判推理等方面作 出最小概念的构成要件解构,其体系较为庞杂,法学专家需承载较大的工作量。并且,要件解构需在 训练过程中不断细化和调整,才能逐步提升算法模型对案件要素抽取的准确率。 (三)事实认定的智能评查受限 事实认定是司法裁判法律适用的前提, “是表示特定的历史情境的命题,需要借助特定的证据加 以证明”。〔7〕对关联诉讼案件事实认定的智能评查主要审查证据与案件事实之间的证明关系。智能 技术实现事实认定的基本路径为: “将所有证据资料转化为数据—通过机器监督学习的方式从全量证 据中抽取证明案件事实的证据要素—基于证据标准设计证据与法律事实认定之间关联关系的算法模 型—训练并确定算法模型—应用模型,输出结果。 ”将待评查诉讼案件中法官采纳的证据及其证明的 事实与基于这一路径得出的结果予以智能评判,以此判断事实认定是否有误。实现这一路径最为核 心的环节是:如何实现证据要素抽取?以及如何实现证据和事实认定之间的关联关系?由于数字化 〔7〕[英]尼尔 • 麦考密克: 《法律推理与法律理论》 , 姜峰译, 法律出版社 2018 年版, 第 29 页。 84 苏成慧 “计算 + 法律”的实现困境与理性考量 表达以规则性、明确性见长,而法律语言具有抽象性和模糊性,证明标准也存在模糊性,这些因素限制 了案件评查智能技术实现的程度。主要表现在以下两个方面。 1. 案件事实要素抽取难度大 从证据中抽取案件事实要素依赖于自然语言处理技术,需要经过文本转换、词法分析(中文分词、 词性标注、命名实体识别)、信息抽取、文本分类与聚类、句法分析、语义篇章分析(词义消歧、语义角色 标注、语义依存分析)等步骤才能实现。〔8〕由于证据资料形式的多元化以及法律概念的抽象性,导致 抽取全面、准确的案件事实要素难度较大。 一方面,证据数据的多源异构性,使得数据分析的难度较大。要实现对关联诉讼案件事实认定评 查的准确性,应尽可能获取与事实认定相关的所有证据材料,包括以文本、图片形式为主的证据材料、 庭审记录等,以及音频、视频等形式的证据或庭审视频资料等。这些数据以非数值数据、非结构化数 〔9〕 据居多, 具有高度异构性,难以用传统符号对法律知识进行科学的语义表达。〔10〕目前需要将这类 数据转化为多维数据表、面向对象的数据模型或者直接基于图像的数据模型,才能对数据进行有效的 分析和处理。〔11〕比如,部分证据材料中的手写文本以及多数信访人的再审申请大多为手写体文本, 而目前对手写体文本的识别主要采用的光学字符识别(OCR)技术准确率不高。 另一方面,法律语言的高度抽象性和模糊性,以及概念所指称的对象在实体空间的多元性,导致 关联诉讼案件要素集构建较为困难。对关联诉讼案件的要素提取是智能技术模拟人工评查案件的前 提,并且每个要素项的提取都必须精确,即基于关联诉讼案件基础数据解构出的要素项必须为能够与 法律术语、法律推理规则相对应的且为最小颗粒度的实体。比如,诉讼法律中的“当事人”这一基础 法律概念,从范围来说包括自然人、法人、非法人组织,而自然人在关联诉讼案件卷宗材料中可能是张 三、李四、 王五等以自然人姓名构成的实体集合; 法人则包括以“×× 公司” “×× 企业” “×× 团体” 等构成的实体名称的集合,非法人组织包括以“×× 机构”“×× 部门”等构成的实体名称的集合。 这是一项需要基于专家经验总结的法律知识体系,以及法律知识与卷宗材料中多元实体的对应关系 体系,通过对特征向量和结果标签进行大量的多层次的标注,构建法律知识最小概念要件与司法数据 实体要素精准对应的模型, 才能予以完善的“工程” 。 成文法规范中存在诸多具有模糊性的法律概念,计算机能够从文本性的关联诉讼案件基础数据 中表示和识别模糊概念,但是要在具体案件中“理解”模糊概念对应的语义及内涵,则需要机器学习 技术总结和归类出每一个模糊概念下的尽可能穷尽的要素项。其存在的障碍在于:一方面,由于法律 所调整的生活事实较为多元,难以穷尽,且每一个模糊概念对应无数的生活事实,加之既有法律规范 中的模糊概念较多,因而需要依赖大量的专家经验才能完成对模糊概念的梳理以及给出模糊概念对 应要素的提取规则;另一方面,理论上不可能存在两个绝对相同的案件,即使通过“专家经验 + 机器 学习 + 海量数据”能够获得基于模糊概念的要素集, 在评查新的案件进行要素匹配时也会存在偏差。 〔8〕 参见何晗: 《自然语言处理入门》, 人民邮电出版社 2019 年版, 第 2-7 页。 〔9〕 所谓“非数值数据”,即相对于数值数据而言的数据类型,指能输入计算机并能够被计算机识别和处理的文字、声音、图形 和图像等。参见王红梅等编: 《数据结构:从概念到 C + + 实现》 ,清华大学出版社 2019 年版,第 9 页。所谓“非结构化数据” ,即相对 于结构化数据、半结构化数据而言的数据类型,以“是否便于用数据库二维逻辑来表示”为依据而作的分类,指在获得特定数据之前 无法获知其结构的数据。参见陈明编: 《大数据技术概论》 , 中国铁道出版社 2019 年版, 第 12-13 页。 〔10〕 参见张妮、徐静村: 《计算法学: 法律与人工智能的交叉研究》 , 载《现代法学》2019 年第 6 期, 第 86 页。 〔11〕 参见陈明编: 《大数据技术概论》 , 中国铁道出版社 2019 年版, 第 12-13 页。 85 华东政法大学学报 2023 年第 2 期 2.“证据—案件事实”推理模型受限 司法裁判中认定案件事实的关键在于判断证据的证明力。由于计算机程序是依据事先编写的代 码指令逐步执行的过程,故其对于客观化、标准化、形式化程度越高的事项越容易实现。就民事证据 制度而言,相较于自由心证,依法定证据制度对证据作出事实认定更具形式性、规则性,因此智能技术 模拟评查关联诉讼案件事实认定的模型设计以法定证据制度为依托更容易实现,即在法定证据规则 要素解构、具体证据要素提取的基础上,依据典型的三段论逻辑结构设计由证据推理案件事实的算法 模型。但基于这一模型的事实认定过程过于量化,难以确保案件事实认定的客观性。 自由心证的核心在于法官基于经验法则和逻辑规则,通过对证据的综合审查判断,形成对证据 的内心确信,以此认定待证事实。〔12〕在自由心证制度下,经验法则作为事实认定的实质性根据,本质 上是法官事实认定三段论推理的大前提,这是由经验法则在内容上具备一定程度的客观性所决定的。 由于“经验法则系对于过去经验进行不完全归纳的产物,与演绎相比,正确地进行归纳推论的前提必 须将‘所有’相关的经验知识作为背景” 。〔13〕因此,以完全归纳为理想目标追求的经验法则,似乎为 以数据为基础、 擅长归纳分析的智能技术模拟经验法则判断证据证明力提供较好的适用场景。 但是,由于经验法则是客观上存在的不成文法规则,对经验法则的适用存在诸多难以规则化、逻 辑化、形式化、标准化的因素,且不可避免地受到法官主观因素的影响,较大程度限制智能技术在该领 域作用的发挥。具体而言,这种限制主要表现在三个方面:其一,经验法则系来自日常生活中基于经 验积累而形成的一般性认知、经验、常识、法则、习惯等,现阶段人工智能技术还难以实现。其二,即便 通过构建人类经验法则知识图谱的方式来辅助智能技术实现经验法则的适用,也受限于经验法则范 围的广泛性和数量的无限性而难以实现。其三,经验法则的选取和适用受主观因素的影响,不可避免 地受到法官性格、情绪、心理素质、道德情操、 职业水平等因素的制约。〔14〕 (四)法律规范援用的智能评查受限 智能技术对已结案件法律适用的评查模拟人工评查案件的思路。在法律推理之前,须探寻可得 适用之法律规范,谓之“找法” ,即法律推理大前提的获取,存在三种情形:其一,有可适用的法律规范; 其二, 虽有规定,但过于抽象, 须加以具体化方能适用之; 其三,没有可适用的法律规范。〔15〕 首先,在明确有可适用的法律规范时,当前语义挖掘技术难以实现对所有法律规范文义的准确 “理解” ,尤其对于涉及价值判断的论理解释。就文义解释而言,司法裁判人员只需从法律规范的文字 和语法上对规范的含义和内容予以阐释。〔16〕对于计算机而言,其能够实现对法律规范文字的表示, 但要“理解”文字的语义却较为困难。比如,对“不可抗力”这一法律术语进行解释时,法官能够快速 准确解释为“不能预见、 不能避免并且不能克服的客观情况” ,这是因为其具备普遍的约定俗成的认知 观念和人际交往的共识。但对于计算机而言,则需通过给定大量关于“不可抗力”情形的案例,设置 机器学习算法,通过对模型的不断测试和调整,才能实现计算机对“不可抗力”的“理解” 。要达成这 一目标需要基于足够多的数据搭建语料库,然后对语料库进行结构化处理,而后运用向量距离计算的 方式计算语词间的关联情况。即便如此,也难以保证计算机对语词的理解达到人类创造该词汇时的 〔12〕 参见刘春梅: 《自由心证制度研究:以民事诉讼为中心》 , 厦门大学出版社 2005 年版, 第 5-8 页。 〔13〕 刘春梅: 《自由心证制度研究: 以民事诉讼为中心》 , 厦门大学出版社 2005 年版, 第 78 页。 〔14〕 参见刘春梅: 《自由心证制度研究:以民事诉讼为中心》 , 厦门大学出版社 2005 年版, 第 80 页。 〔15〕 参见梁慧星: 《民法解释学》, 法律出版社 2015 年版, 第 195 页。 〔16〕 参见雍琦等: 《法律适用中的逻辑》, 中国政法大学出版社 2002 年版, 第 288-293 页。 86 苏成慧 “计算 + 法律”的实现困境与理性考量 本义。〔17〕而在整个法律规范体系中,却存在诸多类似术语,均需以足够多的案例作为基础大数据才 能支撑语料库的构建。而目前我国司法大数据的使用存在着数据质量不高、 数据完整性不足、 数据“支 〔18〕 离破碎”的状态, 难以支撑智能评查关联诉讼案件语义理解所需的海量且高质量数据之需求。除 此之外,司法实践中大部分用于裁判案件的法律规范还需基于论理解释才得以恰切适用,需考虑立法 者的调整意图、目的及规范立场。〔19〕于此主观性较强的事项,当前的智能技术更加难以企及。并且 计算机在模拟对“不确定概念和一般条款的价值补充”的评查时,需要考量社会伦理、价值、规范及公 〔20〕 平正义之原则, 这些因素在计算机中“可规则化、 可程序化”的空间则越发狭小。 其次,关于法律漏洞,从程序设计原理的角度而言,在假定智能技术已实现制定法解释的精确性 与合理性的前提下,对于“是否存在法律漏洞”的判定设定计算规则相对容易, 但对于“如何填补漏洞” 则难以设定。即在假设智能技术“已全面、精确解构所有法律规范的构成要件,已全面、完整、精确地 提取所有法律要件要素,已厘清所有要件要素之间的逻辑关系, 已构建较为精确的‘证据—法律事实’ 推理模型,已实现准确理解法律术语的语义,法律解释精确、合理”的前提下,若未发现与待评查案件 相匹配的规范, 则可设定“存在法律漏洞” 的结论。实际上, 这种假设前提存在诸多难以实现的障碍(前 已述及)。即使这些障碍能够突破,也只能初步解决是否存在法律漏洞的问题,至于该如何填补漏洞, 则需考虑法理、习惯、规范意旨等因素,甚至进行创造性补充。〔21〕这对于现阶段只擅长依照既定代码 从数据中获取经验的智能技术程序而言, 是难以实现的。 (五)裁判结论合理性的智能评查受限 “每一种法律案件之判决,不外是法律逻辑推理的结果。”〔22〕对关联诉讼案件的评查遵循案件审 判活动的思维过程, 即“获得案件事实—择取法律规范—解释法律规范—形成对法律规范与案件事实 〔23〕 的价值和逻辑关系的内心确信—形成判决” 。但法律逻辑并非简单的形式逻辑, 其在司法裁判中所 扮演的角色是手段而非目的,其只作为构成价值判断命题之有效性的推理工具。〔24〕法官需要在对法 律规范与案件事实的价值和逻辑关系形成内心确信的基础上,作出判决结果。因此,对司法裁判结论 合理性评查的重点在于评价法官基于大小前提所作的逻辑涵摄及形成内心确信的价值评价。 一方面,基于演绎推理的三段论模型,由于具备形式逻辑的特征,智能技术能够模拟实现推理规 则,得出裁判结论。但如前所述,由于在案件事实的认定和法律适用的过程中均存在诸多计算机难以 实现的主观因素,可能导致裁判结论的僵化。另一方面,智能技术难以实现法官基于内心确信而获 得合理的裁判结论。法官内心确信的形成依赖于依法裁判和自由裁量权的行使,在联结认定的案 件事实和援用的法律条款导出裁判结果时,法官面临着如何合理选择处理结果的问题,这些问题体 现在刑事案件中的定罪与量刑、民事案件中的责任划归和裁量等方面。〔25〕法官自由裁量不仅依照 〔17〕 参见栗峥: 《人工智能与事实认定》 , 载《法学研究》2020 年第 1 期, 第 122-123 页。 〔18〕 参见孙晓勇: 《司法大数据在中国法院的应用与前景展望》 , 载《中国法学》2021 年第 4 期, 第 138 页。 〔19〕 参见[德]卡尔 • 拉伦茨: 《法学方法论》 , 黄家镇译, 商务印书馆 2020 年版, 第 409-427 页。 〔20〕 参见杨仁寿: 《法学方法论》 ,中国政法大学出版社 2013 年版, 第 185-190 页。 〔21〕 参见杨仁寿: 《法学方法论》 ,中国政法大学出版社 2013 年版, 第 191-207 页。 〔22〕 苏俊雄: 《刑事法学的方法与理论——如何从事法律思考?》 , 台湾环宇出版社 1973 年版, 第 148 页。 〔23〕[美]鲁格罗 • 亚狄瑟: 《法律的逻辑——法官写给法律人的逻辑指引》 , 唐欣伟译, 法律出版社 2007 年版, 总序第 2-3 页。 〔24〕 参见[美]鲁格罗 • 亚狄瑟: 《法律的逻辑——法官写给法律人的逻辑指引》 ,唐欣伟译,法律出版社 2007 年版,主编按语 第 4-6 页、正文第 3 页。 〔25〕 参见雍琦等: 《法律适用中的逻辑》 , 中国政法大学出版社 2002 年版, 第 344-350 页。 87 华东政法大学学报 2023 年第 2 期 〔26〕 且法官个人法律意识的形成源自其在社会生活 法律和事实作出,还受其个人法律意识的支配, 中形成的认知、偏见、司法审判经验以及对司法正义的追求等因素,这些因素恰是目前智能技术应 用的“短板”。 因此,目前智能技术评查司法裁判结论的合理性还存在较大困难。在涉诉信访案件处置的应用 场景下, “关联诉讼案件判决结果不公平”是多数信访人的信访理由,对“公平与否”的判断缺乏明确 的、可规则化的标准。而对判决结果是否公平的审查必然涉及对法官自由裁量的审查,由于法律思维 活动的自由裁量缺乏明确的操作规则, 限制了智能技术在该领域的实现程度。 三、 “计算 + 法律”的双向审视:形式理性与实质理性的平衡 智能技术得以渗透司法领域的基础在于法律思维具备的规则性、逻辑性、体系性。在涉诉信访案 件全过程智能推演的场景下,虽然智能技术模拟案件评查的过程较为复杂,且存在难以逾越的障碍, 但是由于司法裁判活动基于相对可明确的案件事实、明确的法律规范、严格的司法程序、明确的判决 结论等要件展开,这在一定程度上为智能技术模拟案件评查提供应用空间。〔27〕伴随数据流通制度的 不断完善及智能技术水平的不断提升,计算与法律的融合将存在不断加深的可能性。但是,在追求“计 算 + 法律”形式理性的同时,亦不可忽略实质理性的内在要求,仍需以规范的视角审视之。 (一)数据整合与多元价值考量 任何机器学习算法最终的应用价值都取决于训练算法时所使用的数据,数据的量越大、内容越 全、质量越高,越有助于计算法律的实现。因此, “全量数据”的实现是智能技术模拟涉诉信访案件全 过程智能推演的基础。该场景下的数据整合包括三种情形。一是司法数据的整合。因待评查的关联 诉讼案件为已结案件,该案件的司法数据整合,包括不同审级法院的数据整合,亦包括不同司法部门 之间关于同一案件的数据整合。二是司法部门与其他非司法行政部门数据的整合。比如,关于信访 人的社保、受教育程度、家庭基本情况等数据存储在其他政府部门。三是与信访人相关的社会行业数 据的整合。主要包括与信访人相关的消费、 医疗、职业数据等。 但是,在该场景下分析的数据均是与个人相关的数据,基于实质理性的内在要求,不可忽视对这 些数据使用的正当性及限度的考量,其核心在于如何平衡国家机关公权力的行使与个人信息权益保 护之间的价值冲突。在当前以数据赋能国家治理的背景下,作为公共组织的国家机关需处理各类数 据信息,以实现组织的功能,进而实现公共管理和服务的组织目标。〔28〕但由于不同国家机关掌握的 个人数据类型和敏感程度不同,若不加限制地整合不同部门收集的个人数据并分析利用,必然导致对 个人隐私的过度侵犯。在涉诉信访案件全过程智能推演的预设场景下,为高效处置涉诉信访案件,对 信访人进行“人物画像”,分析信访人是否因存在人格偏执、精神障碍、经济困难、法律意识淡薄等原因 而导致其信访(不合理诉求) ,这将会导致涉诉信访人的个人隐私和个人信息权益被侵犯,有违比例原 则。从制定法层面而言,虽然《个人信息保护法》第 34 条规定国家机关处理个人信息需基于法定职责, 并且“不得超出履行法定职责所必需的范围和限度” , 明确了国家机关处理个人信息的“合法性原则” , 〔26〕 参见张军: 《法官的自由裁量权与司法正义》 , 载《法律科学(西北政法大学学报) 》2015 年第 4 期, 第 16-22 页。 〔27〕 参见张保生: 《人工智能法律系统的法理学思考》 , 载《法学评论》2001 年第 5 期, 第 13 页。 〔28〕 参见王锡锌: 《行政机关处理个人信息活动的合法性分析框架》 , 载《比较法研究》2022 年第 3 期, 第 92-95 页。 88 苏成慧 “计算 + 法律”的实现困境与理性考量 但缺乏对合法性内容的具体规定,仅具有“象征性”立法的色彩。〔29〕因此,在涉诉信访案件全过程智 能推演的预设场景下,整合信访人医疗、消费、社保、家庭情况等不同职能机构存储的数据并对信访人 精准“人物画像”的预设, 既不具备学理上的正当性, 也不具备制定法的基础。 为了保障涉诉信访关联诉讼案件当事人的合法权益,监督司法公平正义,整合关联诉讼案件相关 司法数据用于诉讼案件的智能评查,具备价值选择的正当性。但是,由于关联诉讼案件的相关数据被 存储于不同的司法机关,数据整合必然伴随数据安全风险。数据安全风险的产生源于技术本身及风 险管理,即因采取的安全保障技术水平不足(存在网络安全漏洞、被黑客攻击等)以及数据安全管理措 施(网络管理、数据管理、技术人员操作管理等)不到位导致的数据安全风险。即便采用加密技术保障 特定局域网中的数据安全,也仍然不可避免地存在着基于网络攻击的风险。因此,需完善司法数据流 通的安全保障制度,明确各层级法院之间以及法院与公安机关、检察院等司法部门之间关于司法案 件数据共享的技术标准,以保障数据整合过程中的国家秘密、商业秘密、个人信息、个人隐私等数据 的安全。 (二)算法优化与风险防范 以逻辑和运算为基础的算法是智能技术的核心。在当前数字技术赋能社会治理的背景下,算法 的形式理性和工具理性得以彰显,但社会治理更应侧重于对实质理性和价值理性的考量,以实现“善 治”的追求,如果过度追求技术应用之形式理性, 则可能导致对社会治理实质理性的消解。〔30〕在智能 技术模拟涉诉信访案件全过程智能推演的预设场景下,技术实现的关键算法在于对信访人“人物画 像”以及关联诉讼案件评查的算法。前已述及, 因对信访人的“人物画像”违反比例原则,故该场景下 对信访人“人物画像”的算法与人权保障及“善治”追求的基本价值相悖。而关于关联诉讼案件评查 的算法目前尚处于初级阶段,在形式理性的道路上尚可继续探索,但需秉持“人工智能对人类的依附 关系”〔31〕之立场,以价值衡量为基础,防范算法优化迭代过程中产生的风险。 一方面,程序员对司法裁判知识体系的深刻理解、法学专家对机器智能基本原理的充分把握,是 助益高效算法研发、推进诉讼案件智能评查的关键。智能技术辅助司法案件评查系统的研发,有赖于 法律知识图谱的构建,而法律知识图谱的构建除海量司法大数据之外,还依赖于专家经验和机器学习 算法。在专家系统的构建路径中,需技术人员在充分理解法律要件和各要件之间关联关系的基础上, 通过机器学习算法模型的设计,将法律要件对应的要素从数据中提取,并构建要素之间的关联关系。 而在以机器学习为主导的构建路径中,由于计算机程序模拟的是司法裁判思维,算法研发人员需要深 刻了解司法裁判的思维,并充分掌握法律知识, 才能设置合理、高效的机器学习算法模型。 另一方面,预防算法“偏见”、规制算法“黑箱”,是智能技术辅助司法应用的保障措施。算法决策 已成为数字时代的新型权力,司法领域的算法决策本质在于算法行使裁断权。〔32〕而司法裁判具有较 高程度的专业壁垒,即使在专家经验的配合指导下,负责算法研发和程序编码的技术人员也难以达 到与专业审判人员的知识积累和裁判经验等同的水平,不可避免地存在着非专业的个案认知偏见, 这种偏见可能反映在算法模型和程序代码中。因此,智能技术应用于司法案件评查需依赖于计算法 〔29〕 参见王锡锌: 《行政机关处理个人信息活动的合法性分析框架》 , 载《比较法研究》2022 年第 3 期, 第 94 页。 〔30〕 参见董石桃、董秀芳: 《技术执行的拼凑应对偏差: 数字治理形式主义的发生逻辑分析》 , 载《中国行政管理》2022 年第 6 期, 第 66 页。 〔31〕 陈锐、 孙庆春: 《人工智能司法决策的合法性辨疑》 , 载《西安交通大学学报(社会科学版) 》2021 年第 3 期, 第 3 页。 〔32〕 参见马长山: 《司法人工智能的重塑效应及其限度》 , 载《法学研究》2020 年第 4 期, 第 32-33 页。 89 华东政法大学学报 2023 年第 2 期 学思维,这种思维并非计算思维和法学思维的简单拼接,亦非简单的“由法律人提出问题—计算机专 业人员编写代码”的机械叠加,而是一种有别于传统法学研究方法的独立思维,其遵循的步骤为“将 法学问题形式化为可计算问题—选择合适的计算方法—设计需要的计算机功能—编写程序,实现功 机器学习算法还存在“黑箱”问题,尤其在深度学习的算法模型中, 最终裁判结果 能” 。〔33〕除此之外, 获取过程的透明性受阻,进而影响裁判结果的合理性。故可要求算法设计者说明其“算法的假设和限 制、算法的逻辑、算法的种类、算法的功能、算法的设计者、算法的风险、算法的重大变化等”。〔34〕对于 〔35〕 深度学习算法,甚至程序员也无法完全解释算法是如何具体给出决策结果的, 对此应秉持“智能评 查技术在案件评查中的辅助地位,其评查结论仅具参考价值”的立场,最终裁判结果和评查结果的合 理性仍应由法官来决定。 四、结语 当前智能技术在司法裁判领域的深度应用引发学界的规范性思考。本文在涉诉信访案件全过程 智能推演的应用场景下,对“涉诉信访关联诉讼案件智能评查的实现与涉诉信访人‘人物画像’的场 景预设”展开规范性思考, 以“计算思维与法律思维的融合与冲突”为主线, 重点阐述涉诉信访关联诉 讼案件智能评查实现的困境与限度:数据流通制度尚未健全,使得多源基础数据难以全面获取;以案 件类型化为基础、以最小法律概念体系化为核心的关联诉讼案件要件解构体系庞杂;证据数据的多源 异构性及法律概念的模糊性限制案件事实要素抽取的全面性、完整性、精确性,自由心证的主观因素 限制事实认定推理模型的精确度及结果合理性的实现程度;法律解释及漏洞填补中的主观因素限制 法律规范援用的准确性与合理性在智能评查中的实现程度;形成内心确信的多元主观因素限制智能 技术对合理裁判结论评查的实现程度。同时,论及该场景下为查明涉诉信访人信访原因而对信访人 “人物画像”的场景预设, 因违背比例原则, 不具备实质正当性。并强调以计算思维为核心的形式理性 之发展应以安全价值为底线,关联诉讼案件智能评查中的数据安全及算法风险防范是智能技术司法 应用的基本前提。 (责任编辑:陆宇峰) 〔33〕 参见邓矜婷、 张建悦: 《计算法学:作为一种新的法学研究方法》 , 载《法学》2019 年第 4 期, 第 109-113 页。 〔34〕 徐凤: 《人工智能算法黑箱的法律规制——以智能投顾为例展开》 , 载《东方法学》2019 年第 6 期, 第 83 页。 〔35〕 参见江溯: 《自动化决策、刑事司法与算法规制——由卢米斯案引发的思考》 , 载《东方法学》2020 年第 3 期, 第 81 页。 90