近日,南方科技大学风险分析预测与管控研究院、商学院助理教授 Sandro Claudio Lera 联合斯坦福大学、麻省理工学院等机构研究者,在国际期刊《自然-计算科学》(Nature Computational Science)发表题为“Data-driven law firm rankings to reduce information asymmetry in legal disputes”的研究论文。
该研究创新性地提出基于诉讼结果的律所排名框架AHPI(非对称异质成对交互算法),打破了传统依赖声誉、规模的排名模式,为解决法律市场信息不对称、助力当事人精准选择律所提供了全新科学工具。
在法律纠纷中,优质法律代理是影响诉讼结果的关键因素,但现有律所排名多聚焦声誉、规模和营收,忽视实证诉讼表现,且覆盖范围有限,难以满足当事人的实际选择需求。这种信息不对称导致资源雄厚的当事人更易获得优势,加剧了结构性不公,成为法律市场长期存在的痛点。
为破解这一难题,研究团队构建了包含60,540起美国联邦地区法院民事案件的数据集,涵盖民事权利、合同、劳动、侵权等五大类纠纷,涉及54,541家律所的190,297次对抗交互。基于布拉德利-特里模型(Bradley–Terry model),团队提出AHPI算法,将每起诉讼视为原被告律所间的“竞争性博弈”,通过自然语言处理技术提取案件关键信息,结合案件类型特异性偏差和被告胜诉基线优势,精准估算律所的潜在诉讼能力得分。
该图从四个层级及相关算法、技术角度,客观展示了基于诉讼案件分析律所潜在技能与胜诉概率的流程:潜在排名(Latent ranking)层呈现了律所 B、A、C 的潜在技能分数SB、SA、SC,体现律所在潜在排名体系中的分数分布;观测意见(Observed opinions)层展示法官的文本判决(如 Opinion 1、Opinion N),从中可识别案件涉及的原、被告律所信息;提取信息(Extracted information)层从判决文本中提取结构化信息,包括被告律所、原告律所、案件类型(如合同类、民权类)、案件结果(如A胜诉B、A败诉C);计算胜诉概率(Calculated winning probability)层通过公式量化胜诉概率,例如被告律所B比原告律所A更受青睐的概率,以及最终A胜诉B、A败诉C的概率。公式中融入了案件类型特异性偏差和 valence 概率q,以体现不同案件类型的“被告优势”及结果不确定性。
此外,左侧的自然语言处理(NLP)技术用于从判决文本中提取信息,非对称异质成对交互算法(AHPI)支撑数据处理;右侧的期望最大化算法用于推断潜在律所分数、被告偏差、valence 概率等关键参数,这些元素共同作用于对案件结果的分析。
研究发现,传统声誉型排名(如 Vault 100、ALM Global 200)与实际诉讼胜诉率相关性接近零,而AHPI算法构建的排名在预测未来诉讼结果时,准确率较传统排名显著提升近10%,且覆盖2,064家有充足诉讼数据的律所,适用范围更广。该算法还成功量化了不同案件类型的被告胜诉偏差和结果不确定性,证实律所专业能力对诉讼结果的强影响力(valence概率均高于0.85)。
这项研究的核心价值在于将律所评价从“主观声誉导向”转向“客观结果驱动”,有效降低了法律市场的信息不对称,让普通当事人也能获得量化的律所能力评估依据,助力公平司法。此外,AHPI框架可推广至政治竞争、游说、市场竞争等各类对抗性场景,为复杂系统的异质交互排名提供了跨学科新思路。
南方科技大学博士生 Alexandre Mojon 为论文第一作者,Sandro Claudio Lera 为论文通讯作者,合作作者包括斯坦福大学、麻省理工学院、哈佛大学等机构研究者。南方科技大学为论文第一单位。
论文链接:https://doi.org/10.1038/s43588-025-00899-2
供稿:风险分析预测与管控研究院、商学院
通讯员:谢宇婷
编辑:曾昱雯



