AIGC技术周报|图灵测试不是AGI的智力标准;SegGPT:在上下文中分割一切;ChatGPT能玩好文字游戏吗?

news2024/10/5 17:22:50

AIGC通过借鉴现有的、人类创造的内容来快速完成内容创作。ChatGPT、Bard等AI聊天机器人以及Dall·E 2、Stable Diffusion等文生图模型都属于AIGC的典型案例。「AIGC技术周报」将为你带来最新的paper、博客等前瞻性研究。

牙科的未来:从多模态大型语言模型窥探

ChatGPT 是由 OpenAI 开发的具有数十亿参数的里程碑式大型语言模型(LLM)之一。LLM 因其在自然语言处理任务中令人印象深刻的技能对广泛的领域产生了深远的影响。

一项最新的研究探讨了 LLM 在牙科领域的未来应用。研究介绍了牙科中两种主要的 LLM 部署方法,分别是自动牙科诊断和跨模态牙科诊断。下图展示了根据带有自然语言生成(NLG)的关键字生成的患者记录的叙述输出示例。

其中,借助配备的跨模态编码器,单个 LLM 可以管理多源数据并进行高级自然语言推理以执行复杂的临床操作。研究通过提出一个用例来展示全自动多模态 LLM AI 系统在牙科临床应用中的潜力。

虽然 LLM 提供了显着的潜在好处,但数据隐私、数据质量和模型偏差等挑战需要进一步研究。总体而言,LLM 有可能彻底改变牙科诊断和治疗,这表明牙科临床应用和研究的前景广阔。

论文链接:

https://arxiv.org/abs/2304.03086

扮演佐克,ChatGPT能玩好文字游戏吗?

ChatGPT 和 GPT-4 等 LLM 展示了它们与人类用户交流的卓越能力。一项最新发布的技术报告调查了它们玩文字游戏的能力。在这种游戏中,玩家必须通过与游戏世界的对话来了解环境并做出反应。

Zork I(佐克)是一款非常经典的迷宫类文字游戏,需要角色遵循文化语言命令在大地下帝国中寻找宝藏:它在不同地点之间移动,并与物体互动;游戏程序充当叙述者,描述玩家的位置和动作的后果。

ChatGPT 在人类玩家的帮助下扮演 Zork。下图展示了这个过程的开始:游戏给出的内容被标为紫色;ChatGPT 所说的内容被标为绿色。

研究表明,与所有现有其他系统相比,ChatGPT 表现出了更好的性能,但仍然为较低的智能水平。确切地说,ChatGPT 无法通过玩游戏甚至阅读游戏手册来构建世界模型;它可能无法利用它已经拥有的世界知识;它无法随着比赛的进行推断出每一步的目标。

论文链接:

https://arxiv.org/abs/2304.02868

ChatGPT还需要思维链提示吗?

思维链(CoT)提示可以有效地从 LLM 中引出复杂的多步骤推理。例如,只需在 MultiArith 数据集的每个输入查询中添加 CoT 指令“让我们一步一步地思考”,GPT-3 的准确率就可以从 17.7% 提高到 78.7%。

研究表明,在 ChatGPT 上,CoT 对某些任务(如算术推理)不再有效,而对其他推理任务仍然有效。似乎 ChatGPT 已经使用 CoT 进行了这些任务的训练,从而记住了指令,因此在应用于相同的查询时,即使没有 CoT,它也会隐含地遵循这样的指令。

下图展示了由不同 LLM 在没有任何提示的情况下生成的算术推理任务的示例。研究观察到,ChatGPT 能够在没有 CoT 提示的指导下生成逐步的基本原理。GPT-3 和 Codex 在没有任何提醒的情况下无法生成推理步骤。

论文链接:

https://arxiv.org/abs/2304.03262

SegGPT:在上下文中分割一切

一项研究提出了一种名为 SegGPT 的通用模型,用于在上下文中对所有内容进行分割。将各种分割任务统一成一个通用的上下文学习框架,通过将它们转换成图像的相同格式来适应不同类型的分割数据。

SegGPT 的训练被制定为一个上下文着色问题,每个数据样本都采用随机颜色映射。目标是根据上下文完成各种任务,而不是依赖特定颜色。

经过训练后,SegGPT 可以在图像中执行任意分割任务或通过上下文推理的视频,如对象实例、素材、部分、轮廓和文本。结果表明,无论是定性还是定量,都能很好地分割域内和域外目标。

如下图所示,对于每个样本,左侧的橙色框显示示例/提示图像及其相应的掩码,而右侧的蓝色框显示输入图像和生成的掩码输出。掩码表示附加到图像的明亮区域。每个样本的说明(在黄色框中)仅用于说明。

值得注意的是,SegGPT 可以执行任意对象分割(分割场景的不同组件,如大红球、所有球、所有球的轮廓、顶部表面和阴影),多部分分割(自由女神像的特定部分)、彩虹分割、视频对象分割(没有训练视频)和可学习提示调整的密集语义分割。

参考链接:

https://arxiv.org/abs/2304.03284

图灵测试依然是AGI的标准吗?

即使在最前沿的通用人工智能(AGI)领域,人工系统和人类的差距也是极其明显的。尽管这种差异从根本上划分了每个人的能力,但人类水平的智能(HLI)几十年来一直是 AGI 的目标。

该研究反对图灵测试的二元性,讨论了 AI 专家如何将模仿游戏误解为将计算机系统拟人化的一种手段,并断言 HLI 分散了当前对相关问题的研究。

研究认为,图灵测试应该仅仅被视为 AGI 能力的展示,而不是其智力标准。同时,承认人类和 AI 两个系统之间的基本上下文差异需要区分每个系统的任务。二者应该专注于他们最擅长的任务:分别是抽象问题和专注的个人任务。

参考链接:

https://arxiv.org/abs/2304.00002

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/419230.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Java基础教程之Object类是怎么回事?

前言 在前面的文章中,壹哥跟大家说过,Java是面向对象的编程语言,而在面向对象中,所有的Java类都有一个共同的祖先类,这就是Object。那么Object都有哪些特性呢?今天壹哥就简单跟大家分析一下。 -----------…

刷题记录|Day55● 392.判断子序列 ● 115.不同的子序列

● 392.判断子序列 题目描述 给定字符串 s 和 t ,判断 s 是否为 t 的子序列。 字符串的一个子序列是原始字符串删除一些(也可以不删除)字符而不改变剩余字符相对位置形成的新字符串。(例如,"ace"是"…

pure-admin九州权限系统地址简单读

分成页面权限(ex:权限管理page) & 标签节点权限(ex:下载按钮) 【九州地址娜娜手机𝕍找看看kwk3589提供】以下是范例: /*** admin : 管理员角色* common : 普通角色*/const permissionRouter {path: "/permission"…

C++之入门之缺省参数函数重载引用

文章目录前言一、缺省参数1.缺省参数的概念2.缺省函数的分类(1)全缺省参数(2)半缺省参数3.使用注意二、函数重载1.函数重载的概念3.函数重载的原理--名字修饰(name Mangling)三、引用1.引用的概念2.引用特性3.引用的使用前言 重新…

工地人员工装穿戴识别系统 opencv

工地人员工装穿戴识别系统通过pythonopencv网络模型AI视频智能分析技术,工地人员工装穿戴识别算法模型可对施工现场人员是否佩戴合规穿戴进行自动识别预警。OpenCV的全称是Open Source Computer Vision Library,是一个跨平台的计算机视觉处理开源软件库&…

堆来咯!!!

堆是什么? 是土堆吗? 那当然不是啦~ 堆是一种被看作完全二叉树的数组。 那么什么是完全二叉树呢? 如果二叉树中除去最后一层节点为满二叉树,且最后一层的结点依次从左到右分布,则此二叉树被称为完全二叉树。 堆的特…

开源自动化测试框架有哪些?怎么选择适合自己的

目录 前言 一、Selenium 二、Appium 三、Robot Framework 四、Cypress 五、TestCafe 六、Nightwatch.js 七、JUnit 八、Pytest 总结: 前言 开源自动化测试框架是现代软件开发和测试领域中不可或缺的一部分。它们使得测试人员能够快速、准确地执行测试用例…

Mysql(十) -- 常见问题处理

1. MySQL数据库cpu飙升的话你会如何分析 重点是定位问题。 使用top观察mysqld的cpu利用率 切换到常用的数据库使用show full processlist;查看会话观察是哪些sql消耗了资源,其中重点观察state指标定位到具体sql pidstat 定位到线程在PERFORMANCE_SCHEMA.THREADS中…

HuggingGPT强势来袭,LLM+专家模型,迈向更通用的AI

出品人:Towhee 技术团队 超级组合:HuggingFace ChatGPT HuggingGPT强势来袭。人类仿佛距离真正的AGI又更近了一步。 HuggingGPT是浙江大学与微软亚洲研究院的联手研究,发布之后迅速引发关注,已经开源。 它的使用非常简单&#x…

计算机时间旅行者:NTP如何帮助计算机在时间上保持同步?

应用场景: NTP(网络时间协议)是一种用于同步计算机时钟的协议,它可以让多台计算机在网络上保持同步的时间。因此,NTP可以应用于各种需要时间同步的应用程序中,例如: 计算机网络:在…

《花雕学AI》20:ChatGPT使用之体验评测AI EDU的网页版+桌面端+Android+App store组合

最近准备出门,要去新疆哈密参加活动,一直在寻找手机上可用的AI移动端。昨天在网上偶然找到了AI EDU(这个不是 MSRA 创立的人工智能开源社区),其链接是:https://ai.aigcfun.com,今天就尝试做个相…

三菱FX2N PLC与昆仑通态(MCGS)之间无线通讯

三菱FX2N PLC与昆仑通态(MCGS)之间建立无线通讯,其实就是昆仑通态使用三菱 PLC FX2N 通信口扩展 485 接口通过专用协议对 PLC 站点相应寄存器进行读写操作, 从而实现对站点工作状态的控制。 这种情况下,可以使用三菱PL…

ChatGPT对我们的影响-ChatGPT能给我们带来什么

ChatGPT日常应用 ChatGPT是一种应用广泛的自然语言处理算法,其可以应用于多种日常场景。以下是一些ChatGPT的日常应用: 聊天机器人:ChatGPT可用于构建聊天机器人,通过与用户进行自然语言交互来提供个性化的服务和支持。 新闻稿和…

配置springboot的静态资源访问地址为本机,并使用docker部署

springboot版本 2.7.4开发工具 IDEA 2021.2.4 1. SpringBoot提供的默认静态资源访问方法 resouces目录下的 /static、 /public、 /resouces、 /META-INF/resouces、这四个目录下放置的静态资源都可以通过直接通过以下链接访问 http://localhost:8080/aaa.png 2. 将SpringBoo…

入门力扣自学笔记256 C++ (题目编号:1019)

1019. 链表中的下一个更大节点 题目: 给定一个长度为 n 的链表 head 对于列表中的每个节点,查找下一个 更大节点 的值。也就是说,对于每个节点,找到它旁边的第一个节点的值,这个节点的值 严格大于 它的值。 返回一…

C++中COM组件管理思想实践

在开发一个产品时,其往往有很多子模块,子业务和子功能,这些都可以抽象成组件(C中本质表现就是一个类)。但是如何更好的管理这些类的对象呢?我们可以借鉴微软的COM组件思想来进行对象的注册,创建…

OpenHarmony标准系统开机时长优化

简介 万物互联时代,产品性能至关重要,而系统启动时间是系统性能的重要组成部分,因为用户必须等待系统启动完成后才能使用设备。对于经常需要进行冷启动的汽车等设备而言,较短的启动时间至关重要(没有人喜欢在等待几十秒…

如何手写一个文件索引工具everything(第一章)

第一章(NTFS格式及USN日志) 背景介绍 Windows平台的Everything文件查找速度非常快,优势在于利用了NTFS的USN日志,以及Windows上的文件监测机制我们也可以仿照类似原理,通过查询USN日志、监测Windows平台文件修改、使…

亚马逊卖家如何用facebook推广?

亚马逊作为全球最大的电商平台之一,吸引了大量的卖家和买家。对于亚马逊的卖家而言,如何进行有效的推广和引流成为了他们最关心的问题之一。其中,利用Facebook广告为亚马逊进行推广是一种较为常见的做法。 但是,亚马逊可以用Face…

springboot实现修改用户信息功能

目录 1、UserEntity层 2、UserMapper层 3、UserService层 4、UserController类 5、Postman测试 要实现修改用户信息的功能,需要编写对应的代码: 如: 在UserEntity中定义用户实体类的属性。 在UserMapper中编写修改用户的SQL语句&#…