每日学术速递6.9

news2024/11/23 1:08:12

CV - 计算机视觉 |  ML - 机器学习 |  RL - 强化学习 | NLP 自然语言处理  

Subjects: cs.CV

1.Segment Anything in High Quality

标题:以高质量分割任何内容

作者:Lei Ke, Mingqiao Ye, Martin Danelljan, Yifan Liu, Yu-Wing Tai, Chi-Keung Tang, Fisher Yu

文章链接:https://arxiv.org/abs/2306.01567

项目代码:https://github.com/SysCV/SAM-HQ

摘要:

        最近的 Segment Anything Model (SAM) 代表了扩展分割模型的一大飞跃,允许强大的零样本功能和灵活的提示。尽管接受了 11 亿个掩码的训练,但 SAM 的掩码预测质量在许多情况下仍不尽如人意,尤其是在处理具有复杂结构的物体时。我们提出 HQ-SAM,使 SAM 具备准确分割任何对象的能力,同时保持 SAM 原有的提示设计、效率和零样本泛化能力。我们的精心设计重用并保留了 SAM 的预训练模型权重,同时只引入了最少的额外参数和计算。我们设计了一个可学习的高质量输出令牌,它被注入到 SAM 的掩码解码器中,并负责预测高质量掩码。我们不是仅将其应用于掩码解码器功能,而是首先将它们与早期和最终 ViT 功能融合以改进掩码细节。为了训练我们引入的可学习参数,我们从多个来源组成了一个 44K 细粒度掩码数据集。HQ-SAM 仅在引入的 44k 掩模 detaset 上进行训练,在 8 个 GPU 上仅需 4 小时。我们展示了 HQ-SAM 在跨不同下游任务的一组 9 个不同分割数据集中的功效,其中 7 个在零镜头传输协议中进行了评估。

Subjects: cs.CL

2.Fine-Grained Human Feedback Gives Better Rewards for Language Model Training

标题:细粒度的人类反馈为语言模型训练提供了更好的回报

作者:Zeqiu Wu, Yushi Hu, Weijia Shi, Nouha Dziri, Alane Suhr, Prithviraj Ammanabrolu, Noah A. Smith, Mari Ostendorf, Hannaneh Hajishirzi

文章链接:https://arxiv.org/abs/2306.01693

项目代码:https://finegrainedrlhf.github.io/

摘要:

        语言模型 (LM) 通常表现出不良的文本生成行为,包括生成错误、有毒或不相关的输出。人类反馈强化学习 (RLHF)——人类对 LM 输出的偏好判断被转化为学习信号——最近在解决这些问题方面显示出希望。然而,这种整体反馈传达的长文本输出信息有限;它没有说明输出的哪些方面影响了用户偏好;例如,哪些部分包含什么类型的错误。在本文中,我们使用细粒度的人类反馈(例如,哪个句子是错误的,哪个子句子是不相关的)作为显式训练信号。我们介绍了细粒度 RLHF,这是一个框架,可以从两个方面细粒度的奖励函数中进行训练和学习:(1)密度,在生成每个片段(例如句子)后提供奖励;(2) 结合与不同反馈类型相关的多种奖励模型(例如,事实不正确、不相关和信息不完整)。我们对排毒和长篇问答进行了实验,以说明在自动和人工评估的支持下,使用此类奖励函数进行学习如何提高绩效。此外,我们表明可以使用细粒度奖励模型的不同组合来定制 LM 行为。我们在此 https URL 上发布所有数据、收集的人类反馈和代码。

3.PassGPT: Password Modeling and (Guided) Generation with Large Language Models

标题:PassGPT:使用大型语言模型进行密码建模和(引导)生成

作者:Javier Rando, Fernando Perez-Cruz, Briland Hitaj

文章链接:https://arxiv.org/abs/2306.01545

摘要:

        大型语言模型 (LLM) 成功地从大量文本中对自然语言进行建模,而无需明确的监督。在本文中,我们研究了 LLM 在密码建模方面的功效。我们介绍了 PassGPT,这是一个受过密码泄漏培训的 LLM,用于生成密码。 PassGPT 通过猜测两倍于以前看不见的密码,优于基于生成对抗网络 (GAN) 的现有方法。此外,我们引入了引导密码生成的概念,我们利用 PassGPT 采样过程来生成匹配任意约束的密码,这是当前基于 GAN 的策略所缺乏的壮举。最后,我们对 PassGPT 定义的密码熵和概率分布进行了深入分析,并讨论了它们在增强现有密码强度估计器中的用途。

更多Ai资讯:公主号AiCharm
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/667726.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Reids分布式锁详细介绍原理和实现

Reids 分布式锁 问题描述 1、单体单机部署的系统被演化成分布式集群系统后 2、由于分布式系统多线程、多进程并且分布在不同机器上,这将使原单机部署情况下的并发控制锁策略失效 3、单纯的Java API 并不能提供分布式锁的能力 4、为了解决这个问题就需要一种跨J…

abd shell后,getevent退出方法

abd shell后,getevent退出方法 输入 exit 然后回车退出

一种很新的交互式智能标注技术

随着人工智能应用的大规模落地,数据标注市场在高速增长的同时,也面临着标注成本的挑战。据IDC报告显示:数据标注在AI应用开发过程中所耗费的时间占到了25%,部分医学类应用一条数据的标注成本甚至高达20元。数据精度的高要求、强人…

RocketMQ 环境搭建

环境:linux(centos) 或 windos; jdk 1.8 场景:rocket入门学习 时间:2023-04-20 吐槽:可能是本人学习能力不足,想使用docker搭建rocketmq 一直失败,可能是我想使用的比较新…

正排倒排,并不是 MySQL 的排序的全部!

引言 一个悠闲的上午,小航送了我,一袋坚果,他看我吃的正香,慢慢问道:”温哥,mysql的排序,有什么要注意的吗,不就是正排倒排吗?” 我一听他问我的问题,顿感坚…

软件测试简历如何包装?

首先明确的包装简历不等于欺骗,只是把你的最好一面展示出来,给别人一个好的映像;(就相当于相亲,哈哈) 无论如何包装简历,注意简历上的东西一定要会、一定要会、一定要会(面试官一般…

Java框架-Spring

文章目录 1、你了解Spring IOC吗?2、SpringIOC的应用?3、SpringIOC的getBean方法的解析?4、面试题5、你了解Spring AOP吗?6、事务ACID特性7、事务传播 1、你了解Spring IOC吗? IoC(Inversion of control&a…

C++编程启蒙-2——你适合学习编程吗?

英语差,数学孬,照样可以学好编程。但,如果你逻辑思维差,动力能力弱,那么学习编程真的会难上加难。本课用来帮助读者实现对逻辑思维与动手能力的自我判断,并给出了实际测试方案。 英语差,数学孬&…

15个常见的AI绘画网站推荐

无论你是专业的艺术家还是对人工智能绘画感兴趣的普通人,AI绘画网站都可以为你提供新的创作灵感和艺术体验,给艺术界带来更多的创新和可能性。以下是15个常见的AI绘画网站的介绍。 即时 AI 灵感 「即时 AI 灵感」是通过文字描述等方式生成精致图像的AI…

QGIS实现shape、geojson数据的矢量切片教程

能够实现矢量切片的办法有很多,可以使用geoserver,可以使用qgis,当然也可以自己写代码实现。这篇文章我们来介绍一下如何使用qgis完成shape数据的矢量切片。 首先我们还是要准备一份矢量数据。矢量数据的格式是shape文件或者是geojson文件都…

IDEA下载安装与使用

IDEA下载、安装与概述、使用 IDEA全称InteliJ IDEA,是用于Java语言开发的集成环境,它是业界公认的目前用于Java程序开发最好的工具 集成环境:把代码编写、编译、执行、调试等多种功能综合到一起的开发工具 1 IDEA的下载 官网链接&#xf…

第一章 基础算法(二)——高精度,前缀和与差分

文章目录 高精度运算高精度加法高精度减法高精度乘法高精度除法 前缀和二维前缀和 差分二维差分 高精度练习题791. 高精度加法792. 高精度减法793. 高精度乘法794. 高精度除法 前缀和练习题795. 前缀和796. 子矩阵的和 差分练习题797. 差分798. 差分矩阵 高精度运算 两个大数做…

Day37

思维导图 练习 1> 编写一个名为myfirstshell.sh的脚本,它包括以下内容。 a、包含一段注释,列出您的姓名、脚本的名称和编写这个脚本的目的 b、和当前用户说“hello 用户名” c、显示您的机器名 hostname d、显示上一级目录中的所有文件的列表 e、显示…

Git 多账号多仓库配置 SSH

前言 在我们使用 Git 中,有时候会遇到多账号多仓库的情况,比如公司的 GitLab 和 GitHub,以及自己的 GitHub,这时候我们就需要配置多个 SSH 密钥来区分不同的账号和仓库 生成 SSH 密钥 根据你注册仓库的邮箱生成 SSH 密钥&#…

Kubeadm方式搭建K8s集群 1.27.0版本

目录 一、集群规划 二、系统初始化准备(所有节点同步操作) 三、安装并配置cri-docker插件 四、安装kubeadm(所有节点同步操作) 五、初始化集群 六、Node节点添加到集群 七、安装网络组件Calico 八、测试codedns解析可用性 一、集群规划 环境规划…

Qt 定时器

定时器事件---timerEvent 定时器启动 startTimer(); 注意:定时器参数要是全局或者静态变量。 定时器结束 没有结束函数 定时器标志---timerId int timerIdstartTimer(); startTimer()返回定时器标志 需设置为类的成员--类内使用 定时器使用 通过定时器事件…

设计模式介绍

设计模式的分类 总体来说设计模式分为三大类: 创建型模式,共五种:工厂方法模式、抽象工厂模式、单例模式、建造者模式、原型模式。 结构型模式,共七种:适配器模式、装饰器模式、代理模式、外观模式、桥接模式、组合模式…

JVM体系结构模块

1、类装载器ClassLoader (1)负责加载class文件,class文件在文件开头有特定的文件标示,并且ClassLoader只负责class文件的加载,至于它是否可以运行,则由Execution Engine决定 (2)加…

麻了。。。

同样的初始条件,一个每隔0.05s保存一步数据,一个每隔1.13s保存一步数据。 上面横轴代表时间,纵轴代表Nu。 可以看出其实是不太一样的,一个取平均是24.72,一个是25.34,差距其实有的。 我目前跑算例发现长时间…

【C++】类和对象超全超详细总结(万字详解)

🚀 作者简介:一名在后端领域学习,并渴望能够学有所成的追梦人。 🚁 个人主页:不 良 🔥 系列专栏:🛸C 🛹Linux 📕 学习格言:博观而约取&#xff0…