ChatLaw,开源了!

news2024/11/19 15:24:20

公众号关注 “GitHubDaily”

设为 “星标”,每天带你逛 GitHub!

be40bb5dfd2f7e9dc7e7c58c9d37b089.png

最近这段时间,AI 的整体热度有所下降,但是 AI 技术在各行各业的探索脚步,却一直没有停止。

在 ChatGPT 刚发布时,有不少业内人士认为,AI 所拥有的专业性,严谨性,用来做一些特定行业的智能顾问,兴许这个不错的选择。

法律行业,也是在此其中,最早被人提及,认为最有可能被 AI 颠覆的行业之一。

但不少人经过尝试之后,发现目前 AI 在法律行业的应用,依旧有不少问题需要解决。

其中最为严重严重的,就是 AI 在实际回答问题的时候,经常会出现 Hallucination(幻觉),进而提供一些胡编乱造的回答。

对于法律这种需要各种严谨数据支撑,要求合理且充足论据的应用场景,无论是 GPT-3.5 还是 GPT-4,目前仍有不少问题需要解决。

几天前,来自北大团队的一位朋友找到了我,说他们在 GitHub 开源了一个专注于法律行业的大语言模型:ChatLaw

经过各种评估测试,发现其在法律行业中,所展示出来的实际效果,都要优于现有的大模型。

今天在此给大家郑重介绍下这个项目。

ChatLaw 是一个基于各种中文法律条文、实际案例、判决条文所训练出来的法律大模型,可借助 AI,实现法律合同撰写、案例介绍、条款讲解、司法问题咨询等场景。

8fe08d0f024c5baf6f3cca0a8bf60a65.png

  • GitHub:https://github.com/PKU-YuanGroup/ChatLaw

  • 在线使用:https://chatlaw.cloud/lawchat/

开发者可以利用这个大模型,快速搭建出个人法律顾问与专属智能律师,帮助你更好地解决在日常生活工作中,遇到的各种法律纠纷。

该模型主要拥有 3 个系列(ChatLaw-13B、ChatLaw-33B、ChatLaw-Text2Vec),适用于多种不同场景。

根据参数量级,ChatLaw 可分为 13B 和 33B 版本,两者皆为学术 demo 版,分别对应着 130 亿和 330 亿训练参数。

ChatLaw-13B 是基于姜子牙 Ziya-LLaMA-13B-v1 模型训练而成,中文数据较为丰富,因此在中文对话场景下,表现较为优异,但缺点是训练参数不足,有时候一些较为复杂的法律问题,回答质量偏低。

ChatLaw-33B 是基于另一个中文模型 Anima-33B 训练而成,因为参数较大,因此逻辑推理能力明显上升不少。但是中文语料还是太少,因此在回答时,偶尔会出现一些英文数据。

对于大部分使用用户来说,法律模型更多的交互场景,主要还是围绕法律咨询进行。

为了让 AI 能够更好的理解与响应用户提出的法律问题,北大团队使用了 93 万条真实判决案例数据集,基于 BERT 训练了一个相似度匹配模型:ChatLaw-Text2Vec,让人工智能自动匹配用户提问与法律条文。

用户提问:“如果借款没还,怎么办?”

AI 回答:"合同法(1999-03-15): 第二百零六条 借款人应当按照约定的期限返还借款。对借款期限没有约定或者约定不明确,依照本法第六十一条的规定仍不能确定的,借款人可以随时返还;贷款人可以催告借款人在合理期限内返还"。

结果表明,AI 回答的文本内容与训练数据的相似度计算为 0.9960。通过这种方式,可大幅降低大语言模型所出现的「幻觉」问题,提升答案质量。

在模型评估测试环节,ChatLaw 团队也搞得颇有特色。

他们引入了英雄联盟的 ELO 机制,基于过去十余年的司法考试题目,整理出共 2000 道问题,让 AI 模型去打模型排位赛,并进行评分,最终发现 ChatLaw 的最终得分与胜率都表现颇佳。

14fa85056ff7ac024b70a6c1e701548e.png

未来大语言模型要真正达到可用,提升逻辑推理,降低模型幻觉,是两大亟待解决的核心问题,这也是 ChatLaw 团队的下一步主要研究方向。

在接下来的几个月内,开发者会通过提升模型参数,优化向量数据库,让这两个问题的研究,拥有突破性进展,大家可以拭目以待。

由于今年 AIGC 较火,为此我们也建立了一个 AI 社群,探索更多人工智能领域的前景与应用。

如果你想了解更多实用的 AI 技术与应用,以及 ChatGPT 新进展,可以点击下方链接,加入我们社群进一步交流探讨。

社群入口:ChatGPT 社群,正式上线!

不想错过文章推送?点击下面公众号卡片,给 GitHubDaily 公众号加个星标吧!

3e500124400b9d9ba75c1fc324402f60.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/726506.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【浏览器篇】记录下浏览器保存PDF文件不同方式的小区别

【浏览器篇】记录下浏览器保存PDF文件不同方式的小区别 以前不太注意这些,最近搞文档比较多才发现为何保存的一部分PDF文件里面字体可以复制可以搜索,一部分保存的PDF里面的字体却无法复制、无法搜索等,发现是不同保存方式得到的文档权限不一…

SQL注入攻击原理 实战

我来进行实战了,总在看教程。 文章目录 前言一,网站是否存在sql漏洞二、判断一下字段3. 判断显点4.查找相关信息1.查询数据库2.版本3.数据库表名4.字段名5,查询 总结 前言 提示:这里可以添加本文要记录的大概内容: 前言&#xff…

华为OD机试真题 Python 实现【学校的位置】【2023Q1 100分】,附详细解题思路

目录 一、题目描述二、输入描述三、输出描述四、Python算法源码五、效果展示1、输入2、输出3、说明 一、题目描述 为了解决新学期学生暴涨的问题,小乐村要建所新学校。考虑到学生上学安全问题,需要所有学生家到学校距离最短。假设学校和所有的学生家&am…

unity+pico neo3入门教程1-基础传送

tips:之前入门教程如果没有左手柄,查看一下自己的手柄设置,左右手柄, Helloworld型 1.基础传送,调式地面传送功能,通过手柄默认的“握手键”,瞬移, VR头显,添加Teleport…

Go语言远程调试

Go语言远程调试 1、安装dlv # 安装dlv $ go install github.com/go-delve/delve/cmd/dlvlatest$ dlv version Delve Debugger Version: 1.20.1 Build: $Id: 96e65b6c615845d42e0e31d903f6475b0e4ece6e $2、命令行远程调试 我们远程(Linux服务器)有如下代码: [ro…

(四)Kafka 消费者

文章目录 1. Kafka 消费者相关概念消费者和消费者组(1)横向伸缩消费者(2)横向伸缩消费者组 分区再平衡再均衡的类型(1)主动再均衡(2)协作再均衡(增量再均衡) …

MyBatisAnnotationSqlInjection.ql学习

源码位置 java\ql\src\experimental\Security\CWE\CWE-089 源代码 /*** name SQL injection in MyBatis annotation* description Constructing a dynamic SQL statement with input that comes from an* untrusted source could allow an attacker to modify …

【UE5 Cesium】14-Cesium for Unreal 加载服务器上的倾斜摄影

目录 前言 步骤 一、下载安装tomcat 10 二、下载安装JDK 三、启动Tomcat 四、Tomcat加载倾斜摄影 五、UE中加载Tomcat上的倾斜摄影 前言 上一篇文章(【UE5 Cesium】13-Cesium for Unreal 加载本地倾斜摄影)介绍了如何在UE中加载本地倾斜摄影&am…

链表专题1—24. 两两交换链表中的节点 234.回文链表 143.重排链表 141.环形链表 142.环形链表II 160.链表相交 C++实现

文章目录 24. 两两交换链表中的节点234.回文链表链表转数组统计长度反转后半部分链表 快慢指针 143. 重排链表数组 双指针 超时双队列反转和插入链表 141. 环形链表142.环形链表II160.链表相交 24. 两两交换链表中的节点 迭代法,时间复杂度: O ( n ) O(n…

App store里简单好用的便签app有哪些?

作为一个打工人,我经常需要一个简单而又好用的便签应用来记录我的各种事务和备忘。我曾在App Store里尝试了许多便签应用,但有一款应用真正让我留下了深刻的印象——敬业签。 敬业签的简单和易用性让我爱不释手。无论是添加新的便签,设置提醒…

基础大模型能像人类一样标注数据吗?

自从 ChatGPT 出现以来,我们见证了大语言模型 (LLM) 领域前所未有的发展,尤其是对话类模型,经过微调以后可以根据给出的提示语 (prompt) 来完成相关要求和命令。然而,直到如今我们也无法对比这些大模型的性能,因为缺乏…

为什么程序员更容易抑郁?是因为...

【1】 前段时间,有一位朋友,在后台留言: 《谢谢你听我吐槽,说出来感觉好了很多》 这位程序员朋友在深圳大厂,35岁,10年研发经验,倍感抑郁,吐露了自己的近况: &#xff08…

IDE /skipping incompatible xxx_d.dll when searching for -lxxx_d

文章目录 概述场景复现用以测试的代码编译器位数不匹配导致?保持编译器类型一致再验证编译器位数的影响MingW下调用OS的库咋不告警?以mingW下使用winSocket为例MingW下网络编程的头文件分析该环境下链接的ws2_32库文件在哪里?mingW为啥可以兼容window下的动态库 概…

MySQL自治平台建设的内核原理及实践(下)

总第566篇 2023年 第018篇 本文整理自美团技术沙龙第75期的主题分享《美团数据库攻防演练建设实践》,系超大规模数据库集群保稳系列(内含4个议题的PPT及视频)的第4篇文章。 本文作者在演讲后根据同学们的反馈,补充了很多技术细节&…

【Web狗自虐系列1】Pwn入门之初级ROP

0x0 栈介绍 栈式一种典型的后进先出的数据结构,其操作主要有压栈(push)与出栈(pop)两种操作 压栈与出栈都是操作的栈顶 高级语言在运行时都会被转换为汇编程序,在汇编程序运行过程中,充分利用了这一数据结构。每个程序在运行时都有虚拟地址…

国产化适配再进一步,融云完成欧拉、TDSQL、优炫等多方适配

近期,融云完成了与开源操作系统欧拉(openEuler)、企业级数据库 TDSQL 和优炫的适配工作,国产化上下游生态适配之路再次迈进坚实一步。关注【融云 RongCloud】,了解协同办公平台更多干货。 欧拉(openEuler&a…

DoTween 学习

部分参考:DOTween中文详解(持续更新)_一条爱玩游戏的咸鱼的博客-CSDN博客 官方文档:DOTween - Documentation (demigiant.com) 什么是Tween(补间) 补间,一般指补间动画,例如uni…

Ceph集群的部署

一、Ceph集群的部署 1、集群环境 1.1 集群架构 主机名业务IP存储IP服务器配置系统类型集群角色ceph-mon1-deploy172.17.10.61/16192.168.10.61/242C/4GUbuntu1804mondeploy(部署节点)ceph-mon2172.17.10.62/16192.168.10.62/242C/4GUbuntu1804mon(监控节点)ceph-mon3172.17.…

fun函数方法体=返回值,kotlin

fun函数方法体返回值&#xff0c;kotlin var str: String "fly"fun main(args: Array<String>) {println(getMyString())println(getMyInt())str "phil"println(getMyString())println(getMyInt()) }fun getMyInt(): Int {return if (str.equals(&…

javaweb学习4

作业 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><title>Title</title><script type"text/javascript">//动态绑定表单提交window.onloadfunction (){//得到form2的dom对象var fo…