[每日AI·0501]GitHub 版 Devin,Transformer的强力挑战者 Mamba,Sora 制作细节与踩坑,OpenAI 记忆功能

news2025/1/12 6:55:23

AI 资讯

  • 国资委:加快人工智能等新技术与制造全过程、全要素深度融合
  • GitHub版 Devin 上线,会打字就能开发应用,微软 CEO:重新定义 IDE
  • 在12个视频理解任务中,Mamba 先打败了 Transformer
  • Sora 会颠覆电影制作吗?3 人团队使用 Sora 制作短片完整技术细节&踩坑分享
  • 小红书让智能体们吵起来了!联合复旦推出大模型专属群聊工具
  • OpenAI:记忆功能现已对所有ChatGPT Plus用户开放
  • Phi-3 notebook发布,Phi的调优速度提高了2倍,且VRAM使用减少了50%
  • 使用张量并行技术进行自动驾驶感知模型训练
  • Meta 宣布在旧金山举办首届 Llama 3 黑客马拉松,与 Cerebral Valley 和 SHACK15sf 合作,提供超过1 0K 美元的现金奖励和合作伙伴积分以启动 AI 项目。这一事件强调了 Meta 在促进 AI 社区创新方面的承诺。
  • Google 推出了 Transformer 2 模型,该模型将注意力、递归、检索和前馈网络(FFN)集成到单一模块中,与原始 Transformer 的性能相当,但计算效率提高了 20 倍,并能有效处理高达 100M 上下文长度。

国资委:加快人工智能等新技术与制造全过程、全要素深度融合

报道地址
在这里插入图片描述

GitHub版 Devin 上线,会打字就能开发应用,微软CEO:重新定义 IDE

博客地址

微软的“GitHub 版 Devin” - Copilot WorkSpace,终于上线了!WorkSpace是一种“Copilot 原生”的全新开发环境,目的是让所有开发者都可以用自然语言,把脑海里的创意转化成应用。也就是说,只要有想法,而且会打字,就可以搞软件开发了。

在12个视频理解任务中,Mamba 先打败了 Transformer

论文链接 GitHub地址

探索视频理解的新境界,Mamba 模型引领计算机视觉研究新潮流!传统架构的局限已被打破,状态空间模型 Mamba 以其在长序列处理上的独特优势,为视频理解领域带来了革命性的变革。

来自南京大学、上海人工智能实验室、复旦大学、浙江大学的研究团队发布了一项开创性工作。他们全面审视了 Mamba 在视频建模中的多重角色,提出了针对 14 种模型/模块的 Video Mamba Suite,在 12 项视频理解任务中对其进行了深入评估。

结果令人振奋:Mamba 在视频专用和视频 - 语言任务中均展现出强劲的潜力,实现了效率与性能的理想平衡。这不仅是技术上的飞跃,更是对未来视频理解研究的有力推动。

Sora 会颠覆电影制作吗?3人团队使用 Sora 制作短片完整技术细节&踩坑分享

原文地址

今年2月份,OpenAI 发布了人工智能文生视频大模型 Sora,并放出了第一批视频片段,掀起了 AI 生成视频浪潮。目前,Sora 仍未进行公测,只有一些视觉艺术家、设计师、电影制作人等获得了 Sora 的访问权限。他们发布了一些 Sora 生成的视频短片,其连贯、逼真的生成效果令人惊艳。

最近,被誉为「朋克摇滚皮克斯」的加拿大多媒体制作公司 Shy Kids 发布了一段借助 Sora 制作的视频短片《Air Head》,在社交媒体上迅速引起广泛关注。本周,知名视觉特效总监 Mike Seymour 采访了 Patrick Cederberg,就《Air Head》制作过程、技术难点等信息展开了提问,并在 fxguide 上发布一篇文章介绍了 Sora 在视频实际制作过程中发挥的作用和存在的问题。

小红书让智能体们吵起来了!联合复旦推出大模型专属群聊工具

原文地址

语言,不仅仅是文字的堆砌,更是表情包的狂欢,是梗的海洋,是键盘侠的战场。语言如何塑造我们的社会行为?我们的社会结构又是如何在不断的言语交流中演变的?近期,来自复旦大学和小红书的研究者们通过引入一种名为AgentGroupChat的模拟平台,对这些问题进行了深入探讨。

OpenAI:记忆功能现已对所有 ChatGPT Plus 用户开放

推特地址

记忆功能现已对所有 ChatGPT Plus 用户开放。使用记忆功能很简单:只需开始新的聊天并告诉 ChatGPT 您希望它记住的任何内容。

记忆功能可以在设置中开启或关闭,并且目前在欧洲或韩国不可用。团队、企业版和未来的 GPT 产品将陆续推出。

Phi-3 notebook 发布,Phi 的调优速度提高了 2 倍,且VRAM使用减少了50%

推特地址 模型地址

Phi-3 notebook 发布了!使用 @UnslothAI,相比于 HF+FA2,Phi 的调优速度提高了 2 倍,且 VRAM 使用减少了 50%!

由于采用了滑动窗口注意力机制,不得不对其进行 Mistral 化,并修复了 2048/2047 的 SWA(滑动窗口注意力)错误。还解除了注意力机制与 MLP(多层感知机)的融合,因此 QLoRA 损失有所不同,但 16 位的表现相同。

NVIDIA 与蔚来联合研究:使用张量并行技术进行自动驾驶感知模型训练

原文地址

文章探讨了 NVIDIA 与蔚来合作,利用张量并行技术优化自动驾驶感知模型的 GPU 内存使用。通过分片处理卷积神经网络(CNN)的输入和中间激活值,将它们均匀分配到多个 GPU 上,显著降低了对单个 GPU 的内存占用。

此外,文章详述了在 PyTorch 2.0 中使用 DTensor 实现张量并行的细节,包括模型参数和优化器状态的处理方式,以及卷积操作中必要的数据交换和通信。这种方法不仅提高了 GPU 的利用率,还允许使用更深的模型和更高的分辨率输入,从而提升自动驾驶感知模型的精度和训练效率。

产品投资

「星元AI」获数千万天使轮投资

近日,星元先创网络有限责任公司旗下产品「星元AI」完成了数千万的天使轮融资,此次成功融资为星元先创的发展注入新的活力,本轮资金将重点投向星元先创旗下系统升级和市场推广,为广大服务商提供更多机会。

对于星元先创而言,意味着有望将领先的数字化营销系统和人工智能领域的成就在现有基础上再上新台阶,增强核心竞争力,迅速扩大新兴市场的市场份额;合作也标志着星元先创进一步强化“人工智能+营销系统”的战略,星元先创将加速产品升级和业务全国布局。

微软宣布在印尼的云计算和 AI 领域投资 17 亿美元

官方报道

微软计划在接下来的四年内在印尼投资17亿美元,用于新的云计算和人工智能(AI)基础设施,以及为84万人提供AI技能培训,并支持该国日益增长的开发者社区。这是微软在印尼29年历史中的最大单笔投资。此举旨在帮助实现印尼政府的“2045年黄金印尼愿景”,该愿景旨在将印尼转变为全球经济强国。


我的本博客原地址:https://ntopic.cn/p/ai20240501


微信公众号:Python禅师

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1641721.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Python | Leetcode Python题解之第66题加一

题目: 题解: class Solution:def plusOne(self, digits: List[int]) -> List[int]:n len(digits)for i in range(n - 1, -1, -1):if digits[i] ! 9:digits[i] 1for j in range(i 1, n):digits[j] 0return digits# digits 中所有的元素均为 9retu…

Java——认识异常

目录 一.异常的概念与体系结构 1.异常的概念 1.1算术异常 1.2数组越界异常 1.3空指针异常 2.异常的体系结构 3.异常的分类 3.1编译时异常 3.2运行时异常 二.异常的处理 1.防御式编程 1.1LBYL 1.2EAFP(核心) 2.异常的抛出 3.异常的捕获 3…

1081 检查密码(测试点2简析)

solution 潜在的非法字符里可能包含空格&#xff0c;所以不能直接用cin接收string&#xff08;测试点2&#xff09; #include<iostream> #include<string> using namespace std; int judge(string s){if(s.size() < 6) return 1;int num 0, c 0;for(int i …

C++基础——输入输出(文件)

一、标准输入输出流 C 的输入输出是程序与用户或外部设备&#xff08;如文件、网络等&#xff09;之间交换信息的过程。 C 提供了丰富的标准库来支持这种交互&#xff0c;主要通过流的概念来实现。 流&#xff1a;抽象概念&#xff0c;表示一连串的数据&#xff08;字节或字…

Python爬虫--爬取糗事百科段子

爬取糗事百科段子&#xff1a; 段子在 <div class"content"> 里面的 <span> 标签里面 不过这里有个坑&#xff0c;div 标签跟 span 标签 之间有很多空行 普通 .*? 是匹配不了的&#xff0c;需要使用模式修饰符 S S 的意思 让 .(点) 匹配&#xff0c…

政安晨:【Keras机器学习示例演绎】(三十一)—— 梯度集中,提高训练效果

目录 简介 设置 准备数据 使用数据增强 定义模型 实现梯度集中化 训练工具 不使用 GC 训练模型 使用 GC 训练模型 性能比较 政安晨的个人主页&#xff1a;政安晨 欢迎 &#x1f44d;点赞✍评论⭐收藏 收录专栏: TensorFlow与Keras机器学习实战 希望政安晨的博客能够对…

基于php+mysql+html简单图书管理系统

博主介绍&#xff1a; 大家好&#xff0c;本人精通Java、Python、Php、C#、C、C编程语言&#xff0c;同时也熟练掌握微信小程序、Android等技术&#xff0c;能够为大家提供全方位的技术支持和交流。 我有丰富的成品Java、Python、C#毕设项目经验&#xff0c;能够为学生提供各类…

C#语言入门

一、基础知识 1. 程序语言是什么 用于人和计算机进行交流&#xff0c;通过程序语言让计算机能够响应我们发出的指令 2. 开发环境 IDE&#xff0c;集成开发环境。它就是一类用于程序开发的软件&#xff0c;这一类软件一般包括了代码编辑、编译器、调试器、图形用户界面等等工…

springboot 整合 knife4j-openapi3

适用于&#xff1a;项目已使用shiro安全认证框架&#xff0c;整合knife4j-openapi3 1.引入依赖 <!-- knife4j-openapi3 --> <dependency><groupId>com.github.xiaoymin</groupId><artifactId>knife4j-openapi3-spring-boot-starter</artifa…

【C语言】——结构体

【C语言】——结构体 一、结构体类型的声明1.1、结构体的声明1.2、结构体变量的创建和初始化1.3、结构体的特殊声明1.4、结构体的自引用1.5、结构体的重命名 二、 结构体的内存对齐2.1、对齐规则2.2、结构体对齐实践2.3、为什么存在内存对齐2.4、修改默认对齐数 三、结构体传参…

数据库(MySQL)—— 多表查询

数据库&#xff08;MySQL&#xff09;—— 多表查询 多表关系一对多多对多一对一多表查询概述数据准备查询形式笛卡尔积 分类连接查询内连接外连接左外连接右外连接 自连接联合查询 今天我们来进入MySQL中一个非常重要的部分&#xff1a;多表查询&#xff1a; 多表关系 多表关…

【HM】DevEco Studio如何使用代码编程AI助手

大家可能都有用过或了解过github copilot插件&#xff0c;确实为我们编码智能、提升开发效率有很大的帮助。推荐两款国产的ai编程插件&#xff0c;分别是华为的CodeArts Snap和阿里的通义灵码。 DevEco 中如何安装通义灵码&#xff1f; 一、下载通义灵码离线安装包 打开官网…

数组邻接表+堆优化版dijkstra+蓝桥杯2022年第十三届决赛真题-出差

文章目录 邻接表数组实现堆优化版dijkstra蓝桥杯2022年第十三届决赛真题-出差 邻接表数组实现 idx是每条边的地址e保存终点的节点值w保存每条边的权值ne[idx]保存边表&#xff0c;idx的下一个顶点的地址h[a]保存顶点表&#xff0c;a是起点&#xff0c;h[a]是终点的地址 int e…

docker-compose单机容器集群编排工具

前言&#xff1a; docker-compose用来单机上编排容器&#xff08;定义和运行多个容器&#xff0c;使容器能互通&#xff09; Eg&#xff1a;前端和后端部署在一台机器上&#xff0c;现在直接通过编写docker-compose文件对多个服务&#xff08;可定义依赖&#xff0c;按顺序启…

conda环境安装的pyproj包报错

conda环境安装的pyproj包报错 文章目录 conda环境安装的pyproj包报错问题解决参考 问题 在conda创建的Python3.9虚拟环境中安装pyproj包3.6在运行时出现以下报错 UserWarning: pyproj unable to set database path. _pyproj_global_context_initialize()解决 先激活并进入创…

古典密码学简介

目录 C. D. Shannon: 一、置换密码 二、单表代替密码 ① 加法密码 ② 乘法密码 ③密钥词组代替密码 三、多表代替密码 代数密码 四、古典密码的穷举分析 1、单表代替密码分析 五、古典密码的统计分析 1、密钥词组单表代替密码的统计分析 2、英语的统计规…

从零开始学AI绘画,万字Stable Diffusion终极教程(二)

【第2期】关键词 欢迎来到SD的终极教程&#xff0c;这是我们的第二节课 这套课程分为六节课&#xff0c;会系统性的介绍sd的全部功能&#xff0c;让你打下坚实牢靠的基础 1.SD入门 2.关键词 3.Lora模型 4.图生图 5.controlnet 6.知识补充 在第一节课里面&#xff0c;我们…

【数据库原理及应用】期末复习汇总高校期末真题试卷

试卷 一、填空题 1.________是位于用户与操作系统之间的一层数据管理软件。 2.数据库系统的三级模式结构是指________、________、________。 3.数据库系统的三种数据模型是________ 、________、________。 4.若关系中的某一属性组的值能唯一地标识一个元组&#xff0c;则…

【LinuxC语言】信号的基本概念与基本使用

文章目录 前言一、信号的概念二、信号的使用2.1 基本的信号类型2.2 signal函数 总结 前言 在Linux环境下&#xff0c;信号是一种用于通知进程发生了某种事件的机制。这些事件可能是由操作系统、其他进程或进程本身触发的。对于C语言编程者来说&#xff0c;理解信号的基本概念和…

使用 ORPO 微调 Llama 3

原文地址&#xff1a;https://towardsdatascience.com/fine-tune-llama-3-with-orpo-56cfab2f9ada 更便宜、更快的统一微调技术 2024 年 4 月 19 日 ORPO 是一种新的令人兴奋的微调技术&#xff0c;它将传统的监督微调和偏好校准阶段合并为一个过程。这减少了训练所需的计算…