AI大模型日报#0430:疑似GPT4.5模型刷屏、上交实现「蛋白质功能定向进化」、微软紧急撤回WizardLM-2

news2025/1/9 16:12:48

导读: 欢迎阅读《AI大模型日报》,内容基于Python爬虫和LLM自动生成。目前采用“文心一言”生成了今日要点以及每条资讯的摘要。


《AI大模型日报》今日要点: 在AI大模型领域,多项研究进展和行业应用动态引发关注。一夜之间,疑似一个GPT4.5的神秘模型刷屏。科学家Ellie Pavlick正致力于研究大语言模型中的理解证据,试图找到代表概念的神经网络部分,以推动语言模型领域向更直接的方法发展。同时,AI工具如Kimi被发现能直出思维导图,尽管存在局限,但仍展示了AI在工作方式上的改变潜力。在蛋白质功能定向进化方面,上海交通大学实现了全球首次湿实验证实,为生物医药领域提供全新解决方案。此外,复旦大学与小红书联合推出的大模型专属群聊工具以及智慧眼推出的国产自研通用大模型“砭石”等,均展示了AI技术在社交、行业应用等方面的广泛前景。然而,微软紧急撤回大型语言模型WizardLM-2的事件也引发了业界对AI模型性能和毒性测试的关注。

标题: AI知道苹果是什么吗?DeepMind语言模型科学家正把这些概念变得可量化、可测试
 


摘要: 科技记者报道,计算机科学家Ellie Pavlick正在研究大语言模型(LLM)中的理解证据。她专注于描述模型内部的“意义”结构,并试图找到代表概念的神经网络部分。Pavlick认为,语言模型为探索基础对意义的重要性提供了平台,但这是一个复杂的问题,需要精确描述和评估。她强调,我们需要找到科学上合理的方法来处理内部表征,以便正确回答关于智力和模型智能的深刻问题。虽然目前取得重大突破还为时过早,但Pavlick相信,用来描述简单问题的工具对于回答有关智力的深层问题至关重要。她的研究旨在推动语言模型领域向更直接的方法发展,以便更好地理解智力和模型智能的组成部分。
网址: AI知道苹果是什么吗?DeepMind语言模型科学家正把这些概念变得可量化、可测试 | 机器之心
 
标题: AI在用| 原来,Kimi 还能直出思维导图
 


摘要: 科技浪潮下,人工智能如大模型和AIGC正逐渐改变生活和工作方式,但使用门槛仍高。为此,有专栏通过实例介绍AI使用,并鼓励读者分享创新用例。最近发现国内工具Kimi能直出思维导图,操作简便,但仍有局限,如细节展示不足、复杂任务处理能力有限。同时,与其他AI工具相比,Kimi在某些方面还有待提升,如解析能力、稳定性等。新专栏将继续带来AIGC案例,并欢迎改进建议。
网址: AI在用| 原来,Kimi 还能直出思维导图 | 机器之心
 
标题: 全球首次,湿实验证实!上交成功实现「蛋白质功能定向进化」,零数据跨入AGI时代
 


摘要: 上海交通大学洪亮课题组在JCIM期刊发布研究成果,介绍了一种名为ProtLGN的微环境感知图神经网络。该网络可从蛋白质三维结构中学习有益突变,并指导蛋白质设计,提升特定功能。经湿实验验证,ProtLGN在少量或无实验数据下实现蛋白质定向进化,包括提高抗体亲和力、荧光蛋白强度等。此方法解决了传统蛋白质设计方法的效率低下、成本高昂等问题,为生物医药领域提供全新有效的解决方案。
网址: 全球首次,湿实验证实!上交成功实现「蛋白质功能定向进化」,零数据跨入AGI时代|训练|进化|上海交通大学_新浪新闻
 
标题: 小红书让智能体们吵起来了!联合复旦推出大模型专属群聊工具
 


摘要: 科技新闻摘要: 复旦大学与小红书联合推出名为AgentGroupChat的模拟平台,该平台允许人工智能模型在群聊环境中模拟社会行为,以深入研究语言在人类行为中的影响。AgentGroupChat的设计包括角色区分、资源管理和游戏进程,旨在模拟现实生活中的社交结构。此外,研究团队还引入了一种名为Verbal Strategist Agent的智能体框架,以增强模拟中的互动策略和决策制定。实验结果表明,新兴行为是多种因素共同作用的结果,包括环境、角色特征和语言理解能力。该平台有助于更好地理解语言如何塑造社会行为以及社会结构的演变。相关论文和代码已公开发布。
网址: https://www.qbitai.com/2024/04/138807.html
 
标题: 神秘大模型一夜刷屏,能力太强被疑GPT4.5,奥特曼避而不答打哑谜
 


摘要: 科技新闻快讯:一个名为"gpt2-chatbot"的神秘大型语言模型在网络上引起轰动,其能力之强被疑为传说中的GPT-4.5。该模型在国际数学奥林匹克竞赛题目、3D图形生成、逻辑推理等方面表现出色,甚至超越了GPT-4等一众开源模型。网友和科技界人士纷纷猜测其真实身份,有人怀疑这是OpenAI秘密发布的新模型,也有人认为这可能是基于古老GPT-2架构的新训练成果。目前,该模型仅在LMSYS大模型竞技场可供试玩,且试玩机会有限。同时,该模型的中文处理能力也非常出色,引发了广泛关注。然而,其真实身份仍然是个谜。
网址: https://www.qbitai.com/2024/04/138674.html
 
标题: 具身智能最佳形态是什么?它是通往AGI必由之路?八位头部玩家、学者现身说法
 


摘要: 科技记者提炼: 在北京智源人工智能研究院院长王仲远主持的中关村论坛年会上,七位具身智能领域的专家和企业家探讨了具身智能的发展现状和未来趋势。他们普遍认为,虽然具身智能是实现人工智能通用智能(AGI)的重要方向,但目前仍存在许多技术和数据上的挑战。 专家们讨论了具身智能是否一定需要人形机器人,以及硬件和软件发展的优先顺序等问题。他们认为,本体和大脑是相互制约的,需要同时发展。在数据采集方面,真实数据和仿真数据都有其优势和挑战,需要结合使用。 对于具身智能的短期和长期发展,专家们认为短期内可能会有所突破,但长期来看,仍需要解决许多技术难题。他们预测,未来3-5年将是具身智能的逐步渗透期,而5-8年后可能会有快速的发展。 此外,专家们还就自动驾驶和具身智能的关系以及大厂和创业公司在具身智能发展中的角色进行了讨论。他们认为,自动驾驶的发展经验可以为具身智能提供参考,而大厂和创业公司在具身智能领域都有机会取得成功,关键在于目标选择和坚持。 总的来说,虽然具身智能领域仍面临许多挑战,但专家们对其未来发展充满信心。他们相信,通过持续的研究和创新,具身智能将成为实现AGI的重要途径。
网址: 具身智能最佳形态是什么?它是通往AGI必由之路?八位头部玩家、学者现身说法 | 机器之心
 
标题: 「非常接近GPT-4」的WizardLM-2被微软紧急撤回,有什么内幕?
 


摘要: 微软曾开源了名为WizardLM-2的大型语言模型,宣称其性能可媲美GPT-4,但在不久后完全撤回。该系列包括三个模型,其中WizardLM-2 8x22B被认为是最先进的。团队解释称,撤回是因为遗漏了毒性测试,但此举引发了AI社区的质疑和猜测。有人怀疑团队被解雇或微软因技术路线问题与OpenAI产生冲突,但这些都未得到证实。微软建立了一个完全由人工智能驱动的合成训练系统,用于提高模型性能。尽管有诸多猜测,但仍需等待WizardLM-2的重新发布以了解其真实情况。
网址: 「非常接近GPT-4」的WizardLM-2被微软紧急撤回,有什么内幕? | 机器之心
 
标题: 在12个视频理解任务中,Mamba先打败了Transformer
 


摘要: 科技记者报道,机器之心AIxiv专栏持续推动学术交流,已报道2000多篇学术技术内容。近日,南京大学、上海人工智能实验室等团队发布了Video Mamba Suite,探索了状态空间模型Mamba在视频理解领域的潜力。Mamba以其长序列处理优势,为视频理解带来革命性变革,在14种模型/模块的评估中展现出强劲潜力,实现了效率与性能的理想平衡。这不仅是技术飞跃,更是对未来视频理解研究的有力推动。同时,Mamba还有望成为Transformer在视频理解领域的一个有前景的替代方案。研究团队希望Video Mamba Suite能成为未来探索基于SSM的视频理解模型的基础型资源。此外,研究还探索了Mamba在时序模型、时序模块、多模态交互网络和时空模型等不同角色中的潜力,为视频理解领域的未来发展提供了新的思路。
网址: 在12个视频理解任务中,Mamba先打败了Transformer | 机器之心
 
标题: 打通AI「任督二脉」,国产自研通用大模型「砭石」实力迈向AGI
 


摘要: 科技巨头智慧眼最近推出了创新研发的通用大模型——砭石,旨在通过打通AI技术的通用性,推动生产方式的深刻变革与生产力水平的显著提升。砭石基于海量多模态数据训练,具备强大的代码生成、推理及写作能力,并能理解和执行多种任务。其核心技术包括知识图谱、智能大模型和隐私计算,均拥有自主知识产权。砭石采用分层解耦设计,融合机器视觉、自然语言理解、多模态和认知四大基础模型,可广泛应用于医疗、金融、政务等多个行业,实现高度个性化的赋能。智慧眼将继续引领AI技术发展,推动大模型技术在各行各业的应用,为社会发展注入新的生产力。
网址: 打通AI「任督二脉」,国产自研通用大模型「砭石」实力迈向AGI|隐私|模型|砭石_新浪新闻
 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1636200.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

第9篇:创建Nios II工程之读取Switch的值<二>

Q:上一期我们完成了Quartus硬件工程部分,本期我们创建Nios II软件工程这部分。 A:创建完BSP和Nios II Application之后,在source文件main.c中添加代码:system.h头文件中新增了Switch PIO IP的硬件信息,包括…

气象数据nc数据矢量化处理解析及可视化

气象数据可视化是将气象学领域中复杂的数据集转化为图形或图像的过程,以直观展示天气现象、气候模式、趋势和预报结果。气象数据的可视化技术广泛应用于科学研究、气象预报、航空、航海、农业生产、灾害预警系统、城市规划、公众服务等领域。以下是一些关键的气象数…

Stability AI 推出稳定音频 2.0:为创作者提供先进的 AI 生成音频

概述 Stability AI 的发布再次突破了创新的界限。这一尖端模型以其前身的成功为基础,引入了一系列突破性的功能,有望彻底改变艺术家和音乐家创建和操作音频内容的方式。 Stable Audio 2.0 代表了人工智能生成音频发展的一个重要里程碑,为质量…

口袋实验室--使用AD2学习频谱参数测试

目录 1. 简介 2. 频谱相关参数 2.1 频谱相关基本概念 2.1.1 采样时间间隔 2.1.2 采样频率 2.1.3 采样点数 2.1.4 采样时间长度 2.1.5 谱线数 2.1.6 奈奎斯特频率 2.1.7 频谱分辨率 2.1.8 最高分析频率 2.1.9 频谱泄露 2.2 窗函数 2.2.1 AD2的窗函数 2.2.2 测试矩…

Cesium 3dTileset 支持 uv 和 纹理贴图

原理: 使用自定义shader实现uv自动计算 贴图效果: uv效果:

链表算法题总结

链表作为一个基础的数据结构,在开发中经常被使用。 链表往往使用如下的数据结构来表示,struct node 表示链表中的一个节点,data 表示节点的数据;next 表示这个节点指向的下一个节点,如果是链表的尾节点,那…

Vulnhub-DIGITALWORLD.LOCAL: VENGEANCE渗透

文章目录 前言1、靶机ip配置2、渗透目标3、渗透概括 开始实战一、信息获取二、smb下载线索三、制作字典四、爆破压缩包密码五、线索分析六、提权!!! Vulnhub靶机:DIGITALWORLD.LOCAL: VENGEANCE ( digitalworld.local: VENGEANCE …

服务器部署开源大模型完整教程 Ollama+Llama3+open-webui

前言 最近大语言模型大火,正好最近打比赛可能会用得上LLMs,今天就在学校的服务器上面进行一次部署。这样之后就可以直接在内网里面使用学校的LLMs了。 介绍 Ollama:一款可以让你在本地快速搭建大模型的工具 官网:https://olla…

串口协议(例如usart,iic,spi)基础概念汇总

文章目录 同步,异步同步通信:异步通信: 串行,并行串行:并行: 全双工,半双工,单工单工:半双工:全双工: 电平信号,差分信号电平信号&…

Flutter笔记:Widgets Easier组件库(2)阴影盒子

Flutter笔记 Widgets Easier组件库(2):阴影盒子 - 文章信息 - Author: 李俊才 (jcLee95) Visit me at CSDN: https://jclee95.blog.csdn.netMy WebSite:http://thispage.tech/Email: 291148484163.com. Shenzhen ChinaAddress o…

[软件工具]批量根据文件名查找PDF文件复制到指定的地方,如何批量查找文件复制,多个文件一起查找复制

多个文件目录下有多个PDF, 如何根据文件名一个清单,一次性查找多个PDF复制保存 如图所示下面有7个文件夹,每个文件夹里面有几百上千PDF文件 如何从上千个PDF文件中一次性快速找到我们要的文件呢 ? 我们需要找到文件名是这样的PDF&#xff0…

如何删除BigKey1

方案一 拆分为string类型 keyvalueid:0value0..........id:999999value999999 存在的问题: string结构底层没有太多内存优化,内存占用较多 想要批量获取这些数据比较麻烦 方案二 拆分为小的hash,将 id / 100 作为key, 将id …

用Docker 创建并运行一个MySQL容器

可以在DockerHub官网上荡:mysql - Official Image | Docker Hub 指令是:docker pull mysql; 因为文件比较大可能时间比较长,我是跟着黑马的课走的 课程提供的有文件,我就用已有的资源了。 在tmp目录里放入mysql.tar包 然后cd进去 输入指令:docker lo…

Stm32CubeMX 为 stm32mp135d 添加 spi

Stm32CubeMX 为 stm32mp135d 添加 spi 一、启用设备1. spi 设备添加2. spi 引脚配置2. spi 时钟配置 二、 生成代码1. optee 配置 spi 时钟和安全验证2. linux spi 设备 dts 配置 bringup 可参考:Stm32CubeMX 生成设备树 一、启用设备 1. spi 设备添加 选中spi设…

如何从0深入PostgreSQL内核写一个执行器算子?

如何从0深入PostgreSQL内核写一个执行器算子? 大家好,我叫光城,昨天分享了一个主题:如何从0深入PostgreSQL内核写一个执行器算子?今天来总结一下,本篇文章的直播回放可以在b站观看,点击原文或者…

【图论】图论基础

图论不同地方讲的不太一样,本文仅限作者的理解 定义 图是一般由点集 V V V 和边集 E E E 组成。 对于 v ∈ V v\in V v∈V,称 v v v 为该图的一个节点。 对于 e ∈ E e\in E e∈E,一般用二元组 ( u , v ) (u,v) (u,v) 表示 e e e&am…

Android 音视频播放器 Demo(二)—— 音频解码与音视频同步

音视频编解码系列目录: Android 音视频基础知识 Android 音视频播放器 Demo(一)—— 视频解码与渲染 Android 音视频播放器 Demo(二)—— 音频解码与音视频同步 RTMP 直播推流 Demo(一)—— 项目…

HFSS19 官方案例教程W03 - SMA接头与微带分支

SMA接头与微带分支 1►射频接头简介 连接器是电子测量中必不可少的重要部件,无论测试仪表还是DUT,无论线缆还是附件,处处都有形形色色的不同连接器的身影。对于射频工程师而言,经常用到的连接器有N型、BNC型、SMA型、3.5 mm、2.…

【docker 】 IDEA 安装 Docker 工具

打开File->Settings->Plugins 配置 Docker 的远程访问连接 Engine APIURL :tcp://192.168.0.1:2375 (换成自己的docker开放端口) 使用diea的docker插件 查看已有的镜像 创建一个容器 下面是最近更新的文章: 【docker 】 …

sgg_ssm学习--前端搭建遇到的问题

目录 问题1:由于我是解压缩软件nodejs,没有添加系统路径 解决:添加nodejs的路径 到系统 path中 问题2:vscode 终端输入npm命令 报错 解决(如图所示在vscode打开前端工程,终端修改如下配置): 问题1&…