6月人工智能论文推荐

news2025/1/16 18:40:48

Prompt Space Optimizing Few-shot Reasoning Success with Large Language Models

https://arxiv.org/abs/2306.03799

Prompt engineering 是通过提供明确和具体的指令来增强大型语言模型(llm)能力的基本技术。它使LLM能够在各种任务中脱颖而出,例如算术推理、问题回答、摘要、关系提取、机器翻译和情感分析。研究人员一直在积极探索不同的提示工程策略,如思维链(CoT)、零样本思维链(Zero-CoT)和情境学习(In-context learning)。但是一个尚未解决的问题是,目前的方法缺乏确定最佳提示的坚实理论基础。为了解决提示工程中的这一问题,论文提出了一种新的、有效的方法——提示空间。

ESL-SNNs: An Evolutionary Structure Learning Strategy for Spiking Neural Networks

https://arxiv.org/abs/2306.03693

减少SNN模型大小和计算,同时在训练过程中通过修剪和再生连接的进化过程保持准确性。

在推理过程中,Spiking neural networks在功耗和事件驱动特性方面表现出显著的优势。为了充分利用低功耗的优势,进一步提高这些模型的效率,论文探索了在训练后寻找冗余连接的稀疏snn的剪枝方法。在人脑中,神经网络的重新布线过程是高度动态的,而突触连接在大脑发育过程中保持相对稀疏。受此启发,轮文提出了一种高效的SNN进化结构学习(ESL)框架,命名为ESL-SNN,用于从头开始实现稀疏SNN的训练。

Segment Anything in High Quality

https://arxiv.org/abs/2306.01567

用掩码校正对SAM进行修改可以提高性能,特别是在边缘情况下。

SAM代表了一个巨大的飞跃,尽管使用了11亿个掩码进行训练,但SAM的掩码预测质量在许多情况下都存在不足,特别是在处理结构复杂的物体时。论文精心设计重用并保留了SAM的预训练模型权重,同时只引入了最小的额外参数和计算。

SpQR: A Sparse-Quantized Representation for Near-Lossless LLM Weight Compression

https://arxiv.org/abs/2306.03078

通过量化将llm压缩到每个Int4,可以适用于笔记本电脑和移动电话等内存有限的设备,从而实现个性化使用。但是量化到每个参数3-4位通常会导致中等到高的精度损失,特别是对于1-10B参数范围内的较小模型。为了解决这个准确性问题,论文引入了稀疏量化表示(SpQR),这是一种新的压缩格式和量化技术,首次实现了llm跨模型尺度的近无损压缩,同时达到了与以前方法相似的压缩水平。SpQR的工作原理是识别和隔离导致特别大的量化误差的异常权重,并以更高的精度存储它们,同时将所有其他权重压缩到3-4位。

Tracking Everything Everywhere All at Once

https://arxiv.org/abs/2306.05422

从视频序列中估计密集和远距离运动的测试时间优化方法。

先前的光流或粒子视频跟踪算法通常在有限的时间窗口内运行,难以通过遮挡进行跟踪并保持估计运动轨迹的全局一致性。论文提出了一种完整且全局一致的运动表示,称为OmniMotion,它允许对视频中的每个像素进行准确的全长运动估计。OmniMotion使用准3d规范体积表示视频,并通过本地和规范空间之间的双射执行逐像素跟踪

Leveraging Large Language Models for Scalable Vector Graphics-Driven Image Understanding

https://arxiv.org/abs/2306.06094

大型语言模型(llm)在自然语言理解和生成方面取得了重大进展。但是它们在计算机视觉方面的潜力在很大程度上仍未被探索。论文介绍了一种新的探索性方法,使llm能够使用可缩放矢量图形(SVG)格式处理图像。通过利用基于xml的SVG表示的文本描述而不是光栅图像,目标是弥合视觉和文本模式之间的差距,允许llm直接理解和操作图像,而不需要参数化的视觉组件

TrajectoryFormer: 3D Object Tracking Transformer with Predictive Trajectory Hypotheses

https://arxiv.org/abs/2306.05888

三维MOT技术在常用的检测跟踪模式下取得了重要进展。但是这些方法仅使用当前帧的检测盒来获得轨迹盒关联结果,这使得跟踪器无法恢复检测器错过的目标。论文提出了一种新的基于点云的3D MOT框架——TrajectoryFormer。

MovieFactory: Automatic Movie Creation from Text using Large Generative Models for Language and Images

https://arxiv.org/abs/2306.07257

MovieFactory是一个强大的框架,可以根据自然语言的需求生成电影图片(3072×1280),电影风格(多场景)和多模态(声音)电影。作为所知的第一个完全自动化的电影生成模型,论文的方法使用户能够使用简单的文本输入创建具有流畅过渡的迷人电影,超越了现有的制作无声视频的方法,这些无声视频仅限于一个中等质量的场景。为了促进这种独特的功能,利用ChatGPT将用户提供的文本扩展为用于电影生成的详细顺序脚本。然后通过视觉生成和音频检索使脚本在视觉和听觉上栩栩如生。

DEYOv2: Rank Feature with Greedy Matching for End-to-End Object Detection

https://arxiv.org/abs/2306.09165

通过改进对Ground Truth匹配的预测来改进用于目标检测任务的transformer。

提出了一种新的目标检测器DEYOv2,它是第一代DEYO(带有YOLO的DETR)模型的改进版本。与其前身类似,DEYOv2采用渐进式推理方法来加速模型训练并提高性能。论文深入研究了一对一匹配在优化中的局限性,并提出了有效的解决方案,如Rank Feature和Greedy matching。这种方法使DEYOv2的第三阶段能够在不需要NMS的情况下最大限度地从第一阶段和第二阶段获取信息,实现端到端优化。

https://avoid.overfit.cn/post/b4e61ad1dc414676bcad40bc558c892c

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/658567.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

列表、表格、表单

day02:列表、表格、表单 目标:掌握嵌套关系标签的写法,使用列表标签布局网页 01-列表 作用:布局内容排列整齐的区域。 列表分类:无序列表、有序列表、定义列表。 无序列表 作用:布局排列整齐的不需要规…

Bean 的生命周期

观前提示:本篇博客演示使用的 IDEA 版本为2021.3.3版本,使用的是Java8(又名jdk1.8) 电脑使用的操作系统版本为 Windows 10 目录 Spring 的执行流程 1. 启动容器 2. 根据配置完成 Bean 的初始化 3. 注册 Bean 对象到容器中 4. 装配 Bean 的属性 Bean 的生命周期 Bean 的…

掌握Python的X篇_2_Python的安装

掌握Python的X篇_2_Python的安装 1. 软件安装包下载1.1 Python版本的区别1.2 同一版本不同安装包的区别 2. 安装过程3. 验证是否安装成功 1. 软件安装包下载 下载地址:https://www.python.org/downloads/ 可以看到最新版本和历史版本 1.1 Python版本的区别 就像…

express的使用(五) 简单的使用mongodb

原文链接 express的使用(五) 简单的使用mongodb 不要脸的求关注,希望能让大家批评我的不足点,一键三连最好了 看前提示 本篇主要描述关于express中使用mongodb以及mongodb的简单介绍还有初步使用,不涉及任何常用的语法,不建议有…

算法刷题-双指针-反转链表

反转链表的写法很简单,一些同学甚至可以背下来但过一阵就忘了该咋写,主要是因为没有理解真正的反转过程。 206.反转链表 力扣题目链接 题意:反转一个单链表。 示例: 输入: 1->2->3->4->5->NULL 输出: 5->4->3->2-…

AMD CPU微架构分析

一、SoC架构 1.1 整体架构 Zeppelin 参考链接:wikichip: Zeppelin 通过infinity fabric总线将单die分成多die的SoC架构,每个Die包含两个CPU核(CCX)、2各DDR通道、USB、低功耗IO以及多个IFOP和IFIS serdes接口。 如下所述中&…

干翻Mybatis源码系列之第十篇:Mybatis Plugins基本概念与拦截概述

给自己的每日一句 不从恶人的计谋,不站罪人的道路,不坐亵慢人的座位,惟喜爱耶和华的律法,昼夜思想,这人便为有福!他要像一棵树栽在溪水旁,按时候结果子,叶子也不枯干。凡他所做的尽…

vue jointjs 拓扑图 自定义shape 按需引入

只展示部分核心代码,完整代码见文章尾部连接 import jointjs/dist/joint.core.css;// 类库 包含: Paper Graph Cell CellView Element Link 等等 import { dia } from jointjs/src/core.mjs; // 样式库 包含多个分组(basic standard custom ...) import * as standa…

基于Hexo和Butterfly创建个人技术博客,(11) 使用插件增强博客站点能力

Butterfly官方网站,请 点击进入 本章目标: 掌握常用的plugin插件的用法,本文中是butterfly主题内置集成的第三方插件(部分插件需要再次安装); 一、建议开启的三方插件 KaTeX-数学公式 katex:enable: true# true 表示每一页都加载…

C# NX二次开发:通过UFUN函数获取刀具描述,目录号,库号等信息

今天要将的是,在NX中对CAM模块进行二次开发的时候,往往需要获取一些关于刀具使用的信息,这些信息用NXOPEN的的方法录制也可以录制出来,但是录制出来的代码,往往都是一种刀具类型会出现一个Builder。这样在你不知道有多…

淘宝买家订单API

目录 下载安装与运行 支持的订单读取方式 请求数据格式一 请求头示例 数据格式说明 数据格式示例 返回数据格式一 返回头示例 数据格式说明 数据格式示例 请求数据格式二(根据订单编号) 请求头示例 返回数据格式二(根据订单编号…

【随笔记】如何获得铁粉(仅供参考)

文章目录 一、前言二、秘籍2.1 良好的个人简介2.2 统一的文章格式2.3 详细的专栏划分2.4 有序的博客排版2.4.1 目录部分2.4.2 正文部分2.4.2.1 标题分级2.4.2.2 正文分段2.4.2.3 善用多级列表2.4.2.4 章节分割 三、总结 一、前言 在这篇随笔记的开始,我想声明一下&a…

ChatGPT将改变教育,而不是摧毁它

01 学校和大学的反应迅速而果断 就在 OpenAI 于 2022 年 11月下旬发布ChatGPT 的几天后,该聊天机器人被广泛谴责为一种免费的论文写作、应试工具,它很容易在作业中作弊。 美国第二大学区洛杉矶联合大学立即阻止了OpenAI网站从其学校网络访问。其他人很…

【Java】Java核心要点总结 67

文章目录 1. 浮点数运运算会有精度损失2. 构造方法特点 & 不能被重写3. 接口和抽象类的异同4. Object 类的常见方法5. hashCode() 有什么用 为什么要有 hashCode() 1. 浮点数运运算会有精度损失 这个和计算机保存浮点数的机制有很大关系。我们知道计算机是二进制的&#x…

面试时一定要确认该岗位的直属领导是否在场,如果不在,千万不要接offer,有坑!...

对于有心人来说,面试时可以看出许多隐形信息,比如下面这位网友的提醒: 面试时一定要确认这个岗位的直接汇报领导是否参与了面试,如果没有参与,千万不要接offer! 该职位的直接领导不参与面试,只能…

NLP——Topic Modelling

文章目录 A Brief History of Topic ModelsLatent Dirichlet Allocation (LDA)潜在狄利克雷分布核心思想LDA inputLDA output LDA 如何学习Sampling-based mothods 基于采样的方法Infer Topics For New Documents超参数 Variational methods 变分方法 Ev…

java协同过滤算法的校园二手图书网站springboot vue

用户:(商品推荐算法) 1)首页主要由导航栏、图书展示页、分页所组成。访客能浏览网站上的待出售图书的信息,但是若要购买,收藏图书,查看卖家信息则会自动跳转到登录界面,已经登录的用户则可以浏…

WPS AI最全申请与使用手册;AIGC制作游戏音乐;便宜快捷使用完整版SD;人人都能看懂的ChatGPT原理课 | ShowMeAI日报

👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦! 🤖 面向虚拟世界的生成式AI市场全景图 作者在这篇文章中探讨了生成式AI在虚拟世界的应用,并绘制了 Market Map V3.0 (市场全景…

C++ 有用的资源||19道必须掌握的C++面试题

C 有用的资源 C 有用的资源 以下资源包含了 C 有关的网站、书籍和文章。请使用它们来进一步学习 C 的知识。 C 有用的网站 C Programming Language Tutorials − C 编程语言教程。C Programming − 这本书涵盖了 C 语言编程、软件交互设计、C 语言的现实生活应用。C FAQ −…

chatgpt赋能python:Python中的遍历方法详解

Python中的遍历方法详解 在Python中,遍历是处理数据的常见操作。Python提供了多种遍历方法,本文将逐一介绍这些方法的特点、适用场景及使用方法。 for循环 for循环是Python中最常用的遍历方法之一,可以遍历任何可迭代对象。 # 遍历列表 f…