ChatLaw:北大团队智能法律助手,国产大模型成功应用普惠法律服务

news2025/1/11 16:46:28

 技术发展的本质是普惠,用技术降低普通人获取法律知识的成本,向社会输出普惠的公平正义。—— 北京大学 ChatLaw 项目组

刚刚清华团队升级了国产大模型:ChatGLM2-6B,ChatGLM2-6B 初体验。

转眼这两天北大团队推出的智能法律助手 ChatLaw 又火了。(官方7.4更新:服务器暂时崩溃,算力已达上限,我们正在修复,大家可自行前往GItHub部署测试版模型。)

629c7a96e7788d16372254caa8e15352.png

01

全程智能法律援助

以一个普通的劳动者遇到的劳动纠纷全过程为例,ChatLaw 全程提供不亚于专业律师的法律援助:智能理解需求,语音文件输入,结构化抽取要素信息,法条引用准确,智能生成法律文书。

首先,劳动者询问,被公司强行解聘,这种情况下,如何维权?‍‍‍‍‍‍‍

ae604cc410f7ab981a23e3ce0de1f69a.png

ChatLaw 很自然询问是否还有其他文件、邮件之类证据,用户上传后,智能助手自动分析,归纳资料中跟案件相关的信息:

af234b1cf311c71920406880bada70d5.png

2ed67c6c375a1b2ee541105f59da1b8e.png

ChatLaw 是一个支持多模态的大模型,在劳动者补充了语音资料后,将对话录音和之前文件、邮件资料补充到证据链的思维导图中。

62b691d06789426ecda7c78c0ad569f7.png

随后,劳动者询问是否可以提供法律咨询建议,智能助手回答不能,但是可以根据提供的情况,给予简单的分析(意思是仅供参考),并建议寻找法律援助以及咨询律师事务所,最下方还贴心的给予了相关的案例和法条建议。‍‍‍‍‍‍‍‍

3262c9663f0f61d7262837dade248673.png

劳动者进一步请求写一份劳动仲裁的起诉书,ChatLaw给出了一份看起来不亚于专业律师的建议和起诉书。‍‍‍‍‍‍

ef92b8792fb61aba183dddf8825a1b1e.png

调解流程建议书和诉讼状(供参考):

3caa20fa219fd39af218ae18787181ca.png

02

缘起和“先验知识约束”

提供普惠的法律服务是件难事。

2022年,全国法院共受理案件3372.3万件,其中由律师办理诉讼案件仅有824.4万件。74%的案件没有律师参与,当事人只能自己写材料、诉讼、协商。

这背后是专业律师供给不足

截止2021年底,全国共有57.48万执业律师,其中具备高素质与专业能力的律师更少。法律服务市场上,供给远远小于需求,这直接导致了法律服务以被动获客为主的行业结构。相当数量的普通人遭遇社会不公时,找不到律师,也不知道如何运用法律维护权益。

光看知乎上那么多关于“劳动仲裁”的问题数量就知道,无法获得法律援助,而不知道维护权益的普通人有多少。‍‍‍‍‍

举个例子,只是查法条就能难倒70%的普通人。更不用说调解、诉讼所需要的大量流程性文书。

这一切直到大语言模型出现。技术或许成为了解决这一命题的靠谱方案

用户通过多轮对话可以无限逼近事实,从模型里获取准确且专业的建议。

C hatLaw 团队作为技术的提供者,负责任的为模型生成的内容负责。简单地用法律对话数据做微调,不足以支撑在真正法律场景落地。在涉及法律问题时,即使是像GPT4这样最先进的模型,也会出现幻觉和偏误。

为了确保模型生成的稳健性,需要从模型训练阶段就开始介入和干预。团队基于大量的判例文书原始文本和法律法规、地方政策,构建了法律知识库。同时,通过与北大国际法学院、行业知名律师事务所进行合作,确保知识库能及时更新,同时保证数据的专业性和可靠性。

在训练阶段,团队将这些法律数据大规模注入模型,并对这些知识进行特殊处理和加强,以确保模型在后续推理中具备法律先验知识并保持稳健。

同时,ChatLaw团队也在推理时引入多个模块,将通识模型、专业模型和知识库融为一体。通过在推理中进行约束,才能够确保模型生成正确的法律法规,尽可能减少模型幻觉。

这一整套的技术方案被定义为“先验知识约束”。

“先验知识约束”可以确保模型生成法律内容的准确性。团队整理了过去十年的中国国家司法考试试题,并建立了一个包含2000个问题的测试集。通过ELO机制进行检验,ChatLaw模型在测试集上获得了最高分。这充分说明了“先验知识约束”的有效性,让百亿级参数量的模型也能在专业问题上保持一定的准确度。

03

调度模型

只是准确还不够。

法律咨询是高度复杂的场景。其流程标准化,但当事人事实具有多变性。

这意味着,模型的智能度是至关重要的要素。

为了提升模型智能度,同时增强模型的延展性。ChatLaw 用了一个“取巧”的办法。那就是“调度模型”的概念。用针对性微调,训练了一个专用调度模型。

ChatLaw 为调度模型准备了一个极其丰富的模型&插件库。调度模型通过对用户提问进行语义理解,来对子模型和插件进行调度并重组,最终呈现出多个模态的输入和输出。‍‍

033ecdbe8e9f73e8c450281c4aa9d1f9.jpeg

调度模型原理图基于这套体系,ChatLaw 将文件、音频、文字整合在一起,同时支持法律援助、法律文书、思维导图等多样化输出。这使得智能法律助手具有高度的延展性。

例如,当模型判断用户的描述不够具体时,它会向用户要求上传文件,并根据用户提供的信息进行归纳和分析。

不仅仅是归纳事实,ChatLaw还会基于事实生成具体的法律建议、甚至是法律文书。

当用户表露出需要人工服务的意图,模型还会向用户推荐周边的法律援助中心。

所以,基于调度模型,才有了上面一节展示的智能助手全程提供专业的法律方面建议的场面。‍‍

最后,例行放上官方地址,感兴趣的朋友可以去体验:

https://www.chatlaw.cloud/

模型开源地址:

https://github.com/PKU-YuanGroup/ChatLaw

往期热门文章推荐:

为什么对ChatGPT、ChatGLM这样的大语言模型说“你是某某领域专家”,它的回答会有效得多?(二)

终于部署成功!GPU 云环境搭建 ChatGLM2-6B 坎坷路

Prompt 用法大全!让 ChatGPT 更智能的六种策略(下)

拥抱未来,学习 AI 技能!关注我,免费领取 AI 学习资源。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/734148.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

DAY36:贪心算法(三)最大子数组和+买卖股票最佳时机

文章目录 53.最大子数组和枚举思路暴力解法贪心思路完整版时间复杂度 122.买卖股票的最佳时机Ⅱ(解法比较巧妙)思路完整版总结 53.最大子数组和 给你一个整数数组 nums ,请你找出一个具有最大和的连续子数组(子数组最少包含一个元…

Java开发基础系列(一):Java设计概述

😊 作者: 一恍过去 💖 主页: https://blog.csdn.net/zhuocailing3390 🎊 社区: Java技术栈交流 🎉 主题: Java开发基础系列(一):Java设计概述 ⏱️ 创作时间: 2023年…

【漏洞复现】nginxWebUI 存在前台远程命令执行漏洞

文章目录 前言声明一、nginxWebUI 简介二、漏洞描述三、影响版本四、漏洞复现五、修复建议 前言 nginxWebUI 存在前台远程命令执行漏洞,攻击者通过该漏洞获取服务器控制权限进而进一步获取敏感数据信息。 声明 请勿利用文章内的相关技术从事非法测试,由…

# 文盘Rust -- FFI 浅尝

作者: jiashiwen 原文来源: https://tidb.net/blog/cfa03c39 notice"Rust is a trademark of the Mozilla Foundation in the US and other countries." rust FFI 是rust与其他语言互调的桥梁,通过FFI rust 可以有效继承 C 语言…

道德与社会问题简报 #4: 文生图模型中的偏见

简而言之: 我们需要更好的方法来评估文生图模型中的偏见 介绍 文本到图像 (TTI) 生成 现在非常流行,成千上万的 TTI 模型被上传到 Hugging Face Hub。每种模态都可能受到不同来源的偏见影响,这就引出了一个问题: 我们如何发现这些模型中的偏见&#xff1…

Android启动流程优化 上篇

Android启动流程优化 上篇 本文链接:Android启动流程优化 上篇_猎羽的博客-CSDN博客 启动流程 各个阶段图 1、各个阶段的概括总结 分为5个大阶段或者10个小阶段 【字节跳动团队】内部论坛分享也是这么处理的 补充一些只是细节点: application#onCreate()运行…

基于多案例系统学习防洪评价报告编制方法与水流数学模型建模(HECRAS、MIKE、EFDC、Delft3D、FVCOM、SWAT、SWMM等模型应用)

目录 ​专题一 《防洪评价报告编制导则解读河道管理范围内建设项目编制导则》(SL/T808- 2021)解读编制导则解读 专题二 防洪评价相关制度与解析 ★专题三 案例演练解析 专题四 防洪评价地形获取及常用计算实践 专题五 HEC-RAS软件原理及应用案例解析…

leetcode160.相交链表

https://leetcode.cn/problems/intersection-of-two-linked-lists/solution/ 相交链表是指两个单向链表在某个节点处相交,之后形成了共同的后续部分。通常,两个链表的长度不相等。在相交节点之前,两个链表的节点数可能不同,但在相…

Java后端编译与优化

如果我们将字节码看作是程序语言的一种中间表示形式,那编译器无论在何时、在何种状态下把Class文件转换成与本地基础设施相关的二进制机器码,它都可以视为整个编译过程的后端。 1 即时编译器 即时编译器是指运行时将热点代码编译成本地机器码&#xff…

程序员必须掌握哪些算法?——前端开发工程师需要掌握的算法

文章目录 📋前言🎯什么是算法?🎯前端开发工程师需要掌握的算法🧩排序算法(如快速排序、归并排序)🧩搜索算法(如二分搜索)🧩图算法(如广…

【Unity造轮子】2D横版平台跳跃游戏实现多段跳完美手感(含源码)

文章目录 前言先看效果,手感很丝滑原理开始1. 看到检测点的检测范围2. 二段跳实现3. 动画控制器配置 源码扩展完结 前言 随着游戏技术的不断发展,2D横版平台跳跃游戏成为许多玩家的最爱。这类游戏以其简单而有趣的玩法和精致的视觉效果吸引着无数游戏爱…

Kotlin~Decorator装饰器模式

概念 装饰模式指的是在不必改变原类文件和使用继承的情况下,动态地扩展一个对象的功能。它是通过创建一个包装对象,也就是装饰来包裹真实的对象。可以运行时动态添加新的功能,而无需改变原来的代码。 特点: 灵活扩展新的功能动态…

接口设计的总结

目录 前言 设计好接口的 36 个锦囊 总结 前言 作为后端开发,不管是什么语言,Java、Go 还是 C,其背后的后端思想都是类似的。我们做后端开发工程师,主要工作就是:如何把一个接口设计好。所以,今天就给大家…

北京大学考研机试题:二叉树

【题目来源】https://www.acwing.com/problem/content/description/3474/【题目描述】 如上图所示,由正整数 1,2,3…… 组成了一颗特殊二叉树。 我们已知这个二叉树的最后一个结点是 n。 现在的问题是,结点 m 所在的子树中一共包括…

MobileNeRF在Windows上的配置

MobileNeRF于2023年提出,源码地址:https://github.com/google-research/jax3d/tree/main/jax3d/projects/mobilenerf ,论文为:《MobileNeRF: Exploiting the Polygon Rasterization Pipeline for Efficient Neural Field Renderin…

QT自定义工具条渐变背景颜色一例

使用样式定义: QWidget* toolbar new QWidget(this);toolbar->setObjectName("main_tool");toolbar->setStyleSheet("#main_tool{background: qlineargradient(x1:0 , y1:0 , x2:1 , y2:0,""stop:0 rgba(0,255,0, 0.2),"&q…

Nuxt3 components公共组件

1.目录结构 效果实现:写一个公共的right组件,在index和about页面同时引用它 2.index页面引入 index页面显示效果 about页面引用及效果

组件的自定义事件

src/components/School.vue <template><div class"school"><h2>学校名称&#xff1a;{{ name}}</h2><h2>学校地址&#xff1a;{{ address }}</h2><button click"sendSchoolName">把学校名给App</button>…

数据集成的强大联盟:Elasticsearch、Kibana、Logstash、MySQL

通常&#xff0c;很多关系数据项目都使用 MySQL。 它对于标准的 CRUD 操作是有益的&#xff0c;但有时我们需要做额外的过程。 当我们搜索某些内容时&#xff0c;我们会消耗资源或合并多个表。 有时&#xff0c;即使不是&#xff0c;可能仍然需要复杂的 SQL 查询。 也许这不是正…

如何查看OpenAI的AccessToken?

如何查看OpenAI的AccessToken&#xff1f; 记录一下如何查看 OpenAI的 AccessToken 文章目录 如何查看OpenAI的AccessToken&#xff1f;前提具体操作总结 前提 &#x1f4a7;首先&#xff0c;在获取AccessToken前&#xff0c;你需要达成 以下两个条件: 拥有一个可用的OpenA…