JEC-QA:A Legal-Domain Question Answering Dataset 论文阅读

news2024/11/29 12:33:03

文章目录

  • 介绍
  • 相关工作
    • Open QA
  • 数据集
  • 实验
    • 检索策略
    • baseline
    • 实验结果

  • 数据来源:中国国家司法考试
  • 模型准确率 28%,专业人士可以达到81%,非专业人士可以达到64%
  • 数据集下载链接:http://jecqa.thunlp.org/
  • 代码链接:https://github.com/thunlp/jec-qa
  • 检索工具:https://www.elastic.co/cn/

介绍

LQA 为法律案件提供解释、建议、解决方法,一方面为非专业人士提供法律援助、法律咨询,另一方面帮助专业人士提高工作效率,更准确地分析真实案件。

LQA的问题可以分为两大类:

  1. KD-question:knowledge-driven,知识驱动,注重理解法律概念

  2. CA-question:case-analysis,案件驱动,注重分析更多的实际案例

  3. 包含26,365个选择题,每个问题4个选项,有单选也有多选

  4. 提供了一个数据库,包含所有需要的法律知识/法条

  5. JEC-QA给每个问题提供了额外的标签,如问题类型(KD/CA问题)以及问题需要的reasoning,由专业人士标注的数据,有利于LQA的深度分析

JEC-QA需要单词匹配、概念理解、数学分析、多篇长阅读和多跳推理。
e.g.
请添加图片描述

相关工作

Open QA

需要外部领域的知识,第一步检索(https://www.elastic.co/cn/),第二步将模型用在QA模型上给出答案

数据集

【样本量】

请添加图片描述
请添加图片描述

【数据库】

  • 司法考试的参考书包含15个主题,215章

【推理类型】

  1. 单词匹配
    最简单的一种推理,和传统QA类似
  2. 概念理解
    法律领域,模型需要去理解法律概念
  3. 数学分析
    需要进行一些简单的运算,来回答问题
  4. 多篇章阅读
    需要阅读多个段落,整合足够多的证据
  5. 多跳推理
    需要多步完成逻辑推理,得到回答

请添加图片描述

实验

检索策略

总共有15个主题,用三个现有的模型去进新主题分类

  1. BERT
  2. TextCNN
  3. DPCNN

选择用BERT找到TOP2的topic。基于检索到的材料,46%的问题可以回答正确,KD问题显著高于CA问题

输入三元组 ( q , o , r ) (q,o,r) (q,o,r), 表示问题,选项和检索到的阅读理解的篇章

  • q 是词序列
  • o 是一个 n = 4 n=4 n=4 的词序列,表示为 ( ( o 1 , 1 , o 1 , 2 , … , o 1 , ∣ o 1 ∣ ) , … , ( o n , 1 , … , o n , ∣ o n ∣ ) ) \left(\left(o_{1,1}, o_{1,2}, \ldots, o_{1,\left|o_1\right|}\right), \ldots,\left(o_{n, 1}, \ldots, o_{n,\left|o_n\right|}\right)\right) ((o1,1,o1,2,,o1,o1),,(on,1,,on,on))
  • 假设每个选项,有 m = 18 m=18 m=18个阅读篇章, r i , j r_{i,j} ri,j 表示第 i i i 个选项的第 j j j 个阅读篇章,即 r i , j = ( r i , j , 1 , r i , j , 2 , … , r i , j , ∣ r i , j ∣ ) r_{i,j}=\left(r_{i, j, 1}, r_{i, j, 2}, \ldots, r_{i, j,\left|r_{i, j}\right|}\right) ri,j=(ri,j,1,ri,j,2,,ri,j,ri,j),其中 i ∈ [ 1 , n ] i\in[1,n] i[1,n] j ∈ [ 1 , m ] j\in[1,m] j[1,m]
  • 对于输出,有两个不同的任务,即回答单项选择,回答多项选择题
    • 对于单项选择题,需要进行单标签分类,给每个问题输出一个评分向量 s c o r e s i n g l e ∈ R n score^{single}\in \mathbb{R}^n scoresingleRn,表示每个选项是正确的概率
    • 对于多项选择题,需要输出评分向量 s c o r e a l l score^{all} scoreall,每个问题的长度为 2 n − 1 2^n-1 2n1

请添加图片描述

对一些不适用的模型进行了改动:

  • 假设原模型只能输入问题和篇章,没有选项,就将问题和每个选项拼接,获得每个选项的分数 s i s_i si,然后 score s i n g l e = [ s 1 , s 2 , … , s n ] \text{score}^{single} =\left[s_1, s_2, \ldots, s_n\right] scoresingle=[s1,s2,,sn]
  • 如果原模型只能从阅读理解片段中抽出答案,就把输出层修改成线性层,输出打分 s i s_i si
  • 如果原模型不能用于多篇章阅读理解任务,就单独在每个选项的每个篇章上应用该模型,模型输出隐藏层 h i , j ∈ R d h_{i, j} \in \mathbb{R}^d hi,jRd 表示第 i i i 个选项的第 j j j 层,然后在同一个选项的所有表示上用 max-pooling,来得到第 i i i 个选项的隐藏层表示 h i ′ = [ h i , 1 ′ , h i , 2 ′ , … , h i , d ′ ] h_i^{\prime}=\left[h_{i, 1}^{\prime}, h_{i, 2}^{\prime}, \ldots, h_{i, d}^{\prime}\right] hi=[hi,1,hi,2,,hi,d],其中 max ⁡ ( h i , k , j ∣ ∀ 1 ≤ k ≤ m ) \max \left(h_{i, k, j} \mid \forall 1 \leq k \leq m\right) max(hi,k,j1km),然后将 h i ′ h_i^{\prime} hi 通过线性层得到第 i i i 个选项的分数 s i s_i si
  • score s i n g l e \text{score}^{single} scoresingle 输入到线性层中,去获得回答所有问题的 s c o r e a l l score^{all} scoreall

随机选择 20% 作为测试集

baseline

  • co-matching:a single-paragraph reading comprehension model for single-answer questions
  • BERT:a single-paragraph reading comprehension model,用在中文文档上训练的bert
  • SeaReader:医学领域问答,用三种注意力方式,question-centric attention, document-centric attention, cross-document attention,再用一个门层去去噪
  • Multi-Matching:用 Evidence-Answer matching 和 Question-Passage-Answer matching模块来生成匹配信息,拼合起来得到候选项的分数
  • Convolutional Spatial Attention (CSA) :先用注意力机制得到文章、候选答案、问题的标识,再用CNN-MaxPooling去总结邻接注意力信息
  • Confidence-based Model (CBM) :multi-paragraph reading comprehension,pipeline 用于 single-paragraph 阅读理解,应用 confidence-based method 将模型用于 multi-paragraph 上
  • Distantly Supervised Question Answering (DSQA) :用于 open QA,将QA分解,首先过滤掉噪声文档,然后抽取正确信息,选出最好的选项

实验结果

请添加图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/87872.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

web前端大作业(基于HTML+CSS+JavaScript仿阴阳师游戏官网首页作业制作)

🎉精彩专栏推荐👇🏻👇🏻👇🏻 ✍️ 作者简介: 一个热爱把逻辑思维转变为代码的技术博主 💂 作者主页: 【主页——🚀获取更多优质源码】 🎓 web前端期末大作业…

1780. 判断一个数字是否可以表示成三的幂的和

目录题目深搜(不超时)动态规划(超时写法)二维空间优化(一维)题目 给你一个整数 n ,如果你可以将 n 表示成若干个不同的三的幂之和,请你返回 true ,否则请返回 false 。 对…

海德汉机床联网

一、设备信息确认 1、确认型号 数控面板拍照确认: 此系统为:海德汉530操作系统 还有一种情况是面板无任何版本信息,这时就需要进入系统里面再确认。 2、确认通讯接口 打开电器柜后既可看到网口。编号X26 3、确认数控系统软件版本(以620为…

Java+Swing实现自助取款机(ATM)系统-TXT存储数据

JavaSwing实现自助取款机ATM系统-TXT存储数据一、系统介绍1.系统功能2.环境配置3.工程截图二、系统展示1.登录页1.1登录成功2.取款2.1取款成功3.存款3.1 存款成功4.转账5.余额查询6.退出系统三、部分代码AccountDao.javaLoginFrame.javaAccount.java四、其他获取源码一、系统介…

rocketmq源码-producer发送消息

前言 这篇笔记,记录producer发送消息的相关源码 我们以最简单的demo为例 public static void main(String[] args) throws MQClientException, InterruptedException {DefaultMQProducer producer new DefaultMQProducer("please_rename_unique_group_name&…

去哪儿是如何做到大规模故障演练的?|TakinTalks

# 一分钟精华速览 #混沌工程作为一种提高技术架构弹性能力和容错能力的复杂技术手段,近年来讨论声音不断,相比在分布式系统上进行随机的故障注入实验,基于混沌工程的大规模自动化故障演练,不仅能将“作战演习”常态化,…

Spring结合mybatis

目录 一、Spring结合mybatis 二、业务层添加声明式事务 1、事务的传播机制 2、事务的四大特性 3、事务的隔离级别 4、事务属性 一、Spring结合mybatis 1.创建Web工程&#xff0c;导入Spring和MyBatis的相关依赖 <!-- springmybatis整合 --><dependency><…

web渗透安全测试(靶场搭建及常见漏洞攻防)

渗透测试 渗透测试&#xff08;Penetration test&#xff09;即安全工程师模拟黑客&#xff0c;在合法授权范围内&#xff0c;通过信息搜集、漏洞挖掘、权限提升等行为&#xff0c;对目标对象进行安全测试&#xff08;或攻击&#xff09;&#xff0c;最终找出安全风险并输出测…

Denoising Diffusion Probabilistic Models简介

目录概要前向过程nice property逆向过程参数推导简化参考资料概要 Denoising Diffusion Probabilistic Model(DDPM)是一个生成模型&#xff0c;给定一个目标分布&#xff0c;学习模型以便可以从目标分布中采样。 使用马尔科夫链建模。输入是噪声&#xff0c;通过神经网络逐步去…

“乌卡时代”下,跨境电商卖家到底在焦虑什么?

三年前新冠疫情大爆发&#xff0c;现今国家全面解封&#xff0c;但形式任然不稳定&#xff0c;加之国际形势扑朔迷离&#xff0c;各国外贸瞬息万变&#xff0c;跨境电商行业面对的复杂性也随之正变得越来越高。无论是运价&#xff0c;还是爆仓&#xff0c;亦或是港口拥堵等情况…

WPF入门 第一篇 基础布局与简单样式

基础布局与简单样式 首先&#xff0c;创建WPF项目&#xff0c;在自动打开的MainWindow.xaml里面&#xff0c;找到Grid标签&#xff0c;并将它替换为&#xff1a; <Grid><Grid.RowDefinitions><RowDefinition></RowDefinition><RowDefinition>&…

【案例教程】地球科学数据(ERA5、雪深、积雪覆盖、海温、植被指数、土地利用)处理实践

【查看原文】地 球 科 学 常 见 数 据 的 处 理 实 践 技 术 应 用 在地球科学中&#xff0c;不同数据根据具体学科的特色存储为多种数据格式。在科研工作中需要将多种数据进行综合使用分析&#xff0c;因此需要寻找学习通用的数据格式解决方法&#xff0c;把研究的精力聚焦到具…

芜湖~西门子低代码最新组件首发,快来围观!

热爱低代码的小伙伴们&#xff0c;我们又见面啦~ 在与大家长达1年多时间的沟通交流中&#xff0c;我们深刻感受到大家对西门子低代码的浓厚兴趣。为了不辜负大家的厚爱&#xff0c;我们潜心研制了一批前端组件。因为随着商业化的趋势&#xff0c;越来越多的企业级产品对更好的…

web前端实训作业 html+css+javascript 水果超市网页设计实例 企业网站制作

常见网页设计作业题材有 个人、 美食、 公司、 学校、 旅游、 电商、 宠物、 电器、 茶叶、 家居、 酒店、 舞蹈、 动漫、 服装、 体育、 化妆品、 物流、 环保、 书籍、 婚纱、 游戏、 节日、 戒烟、 电影、 摄影、 文化、 家乡、 鲜花、 礼品、 汽车、 其他等网页设计题目, A…

12.7、后渗透测试--python插件执行py脚本

加载python插件&#xff1a;meterpreter >load python查看指令集&#xff1a;meterpreter >helppython执行单条语句&#xff1a;meterpreter > python_execute "import os; cdos.getcwd()" -r cd # 将os.getcwd()赋值给 cd 这个变量&#xff0c;然后用 -…

中英翻译《The number thirteen数字13》

The number thirteen 数字13 一、Pre-reading activity 阅前思考 1.Do you have a lucky number? If so, what is it? 你有幸运数字吗&#xff1f;如果有&#xff0c;是什么&#xff1f; 2.What number is next? 10, 11, 12, ____? 下一个数字是什么&#xff1f; 10、11、1…

设计模式-迭代器模式

迭代器模式UML类图 实现代码如下&#xff08;这里使用的集合是list,也可以使用其他集合这里就不一一展示了&#xff09; public interface Iterator<T> {T next();boolean hasNext(); } 复制代码 public class ConcreteIterator<T> implements Iterator<T>…

商品企划VE课程大纲

课程信息 课程受众: 高中基层管理人员、储备干部&#xff0c;项目经理&#xff0c;商品企划人员&#xff0c;研发人员 课程时间: 2天 授课方式: 理论讲座&#xff0b;实战工作坊&#xff0b;录像观赏&#xff0b;角色扮演&#xff0b;提问互动&#xff0b;分组讨论&#xff0…

Java入门教程(29)——封装

封装是面向对象三大特征之一。 文章目录1.封装的特性2.封装的作用3.访问控制符4.实例1.封装的特性 高内聚、低耦合 2.封装的作用 提高代码的安全性。提高代码的复用性。高内聚&#xff1a;封装细节&#xff0c;便于修改内部代码&#xff0c;提高可维护性。低耦合”&#xff…

Linux常用目录操作及示例操作

文章目录一、常用权限操作1.1 常用权限操作1. chgrp命令2. chown命令3. chmod命令1.2 权限操作实战任务1 创建文件&#xff0c;设置其用户组任务2 修改文件的所有者任务3 修改文件操作权限二、常用目录操作2.1 常用目录操作2.2 目录操作实战任务1 获取命令帮助信息任务2 查看当…