【AIGC半月报】AIGC大模型启元:2024.12(上)

news2025/1/10 21:06:51

【AIGC半月报】AIGC大模型启元:2024.12(上)

    • (1)OpenAI-12日发布会(持续更新中........)
      • Day01-12.06:o1满血版上线(已发布)
      • Day02-12.07:强化微调(Reinforcement Fine-Tuning)(已发布)
      • Day03-12.08:ChatGPT+高级语音功能+增强视觉
      • Day04-12.09:向免费用户发布o1-preview
      • Day05-12.10:新AI Agent预展示
      • Day06-12.11:GPT-4o图像
      • Day07-12.12:新开发者工具
      • Day08-12.13:新文生图模型
      • Day09-12.14:下一代长上下文窗口的GPT模型
      • Day10-12.15:辩论游戏
      • Day11-12.16:Microscope
      • Day12-12.17:增加高级语音使用时长

(1)OpenAI-12日发布会(持续更新中…)

Day01-12.06:o1满血版上线(已发布)

整个发布会仅持续不到15分钟,但包含了巨大的信息量:相比preview版本,满血o1的数学和代码能力均大幅提升,Pro版则是再上一层楼。满血版推理速度更快,比preview快了60%。网友们期待的多模态推理,满血版o1也安排上了。
而满血o1的另一大亮点就是支持多模态输入,具备视觉推理能力,团队也进行了现场展示。

在这里插入图片描述
参考博客:
OpenAI第一场直播就炸场!o1满血版上线,史上最贵订阅费:1450元/月
新o1登顶中文链式推理基准,总分76.12分,速度提升41%

Day02-12.07:强化微调(Reinforcement Fine-Tuning)(已发布)

新功能强化微调(Reinforcement Fine-Tuning),使用极少训练数据即在特定领域轻松地创建专家模型。少到什么程度呢?最低几十个例子就可以。CEO奥特曼表示“效果一级棒,是我2024年最大的惊喜,期待看到人们构建什么!”
  这次发布的主题虽然和普通人没什么关系,但是给领域垂直模型、小型化模型等开辟巨大的想象空间。在现有模型基础上,花费有限算力和数据做增强改进,训练出一个更强的模型。未来很快,就会出现各个领域的o1模型。
  前有OpenAI已经搞定一个强基模型,加上一些高质量的推理问题数据集(不需要正确的推理过程,只要有正确的答案就行),任何人都可以通过Reinforcement Learning Fine-tuning,在现有强大的推理模型基础上训练出推理能力更强的模型。或者,蒸馏出一个更紧凑的小模型,有了领域私有数据和业务逻辑复杂的推理数据集,训出表现更好领域模型。

  • 微调后的o1-mini模型得分提高80%,直接反超o1正式版。
  • 目前OpenAI已开启强化微调研究计划,开发者可以申请强化微调API的alpha版本访问权限。
  • 进行测试时,可使用几十到几千个高质量数据,模型能够通过强化学习自行探索和学习如何推理复杂任务。

强化微调(Reinforcement Fine-Tuning,简称ReFT)
  一种全新(区别于之前的监督微调)的模型定制技术,允许开发者通过数十到数千个高质量任务的数据集,对模型进行针对性优化,并根据提供的参考答案对模型的响应进行评分,使AI在特定领域的复杂任务中表现得更为精准。

参考博客:
OpenAI强化微调登场:几十条数据o1-mini反超o1暴涨80%,奥特曼:今年最大惊喜
OpenAI Day2:支持微调o1, 核心技术竟更早来自字节跳动!「强化微调」技术分析

Day03-12.08:ChatGPT+高级语音功能+增强视觉

增强ChatGPT的高级语音模式,增加视觉功能。
Enhancement of ChatGPT’s Advanced Voice Mode with vision capabilities.

Day04-12.09:向免费用户发布o1-preview

向免费用户发布o1-preview,扩大高级推理模型的使用范围。
Release of o1-preview to free users,expanding access to advanced reasoning models.

Day05-12.10:新AI Agent预展示

展示将在2025年一月推出的AI Agent
Showcase of the GPT Agents coming in January

Day06-12.11:GPT-4o图像

发布GPT-4o图像
Launch of GPT-4o images

Day07-12.12:新开发者工具

发布新的开发者工具
New Developer tools

Day08-12.13:新文生图模型

展示新的文生图模型
Showcase of new Dalle

Day09-12.14:下一代长上下文窗口的GPT模型

发布下一个GPT模型,更大的上下文窗口。
Announcement of the GPT-NEXT model with a bigger context window

Day10-12.15:辩论游戏

发布辩论游戏,教机器辩论简单的问题。
Release of the Debate Game,teaching machines to debate toy problems.

Day11-12.16:Microscope

发布Microscope,这是一个神经网络模型的可视化集合。
Launch of Microscope,a collection of visualizations of neural network models.

Day12-12.17:增加高级语音使用时长

将高级语音模式的使用时间增加到每天20小时
Increases the Advanced voice mode time to 20 hours per day

Sora
发布文生视频模型Sora
Launch of Sora.the text-to-video AI tool.
ChatGPT+圣诞老人风格的语音
为ChatGPT引入一个圣诞老人风格的语音,增添节日气氛。
Introduction of a Santa-inspired voice for ChatGPT, adding festive flair.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2254997.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Mysql学习-Mysql查询(1)

1.基本查询&#xff08;SELECT&#xff09; SELECT语句基本格式&#xff1a; SELECT {*|<字段列表>} [ FROM<表1>&#xff0c;<表2>.. [WHERE <表达式> [GROUP BY<group by definition>] [HAVING <expression>[{<operator><exp…

OpenCV-平滑图像

二维卷积(图像滤波) 与一维信号一样&#xff0c;图像也可以通过各种低通滤波器&#xff08;LPF&#xff09;、高通滤波器&#xff08;HPF&#xff09;等进行过滤。LPF 有助于消除噪音、模糊图像等。HPF 滤波器有助于在图像中找到边缘。 opencv 提供了函数 **cv.filter2D()**&…

WPS解决Word文件引入excel对象文件无法打开提示“不能启动此对象...”的问题

一、问题现象 接收到了一份 Word文件&#xff0c;里面引入了一个Excel对象文件&#xff0c;双击时候&#xff0c;wps出现卡顿&#xff0c;过一会之后弹出错误提示&#xff1a;不能启动此对象... 二、解决方法 1.点击WPS左上角图标&#xff0c;并打开右上角设置&#xff0c;萱蕚…

做异端中的异端 -- Emacs裸奔之路6: 不可能存在的跳转功能

当一个问题存在两难时&#xff0c;市面上就不太可能出现稳定的&#xff0c;大众化的解决方案。 这很多是一个哲学问题 两害权衡&#xff0c; 存在很强的个性差异. 这种问题需要自己解决&#xff0c; 这个就是为什么要使用Emacs或者Vim的原因。 今天分享的一个想法&#xff0…

【Linux】ubuntu下一键配置vim

&#x1f525;个人主页&#x1f525;&#xff1a;孤寂大仙V &#x1f308;收录专栏&#x1f308;&#xff1a;Linux &#x1f339;往期回顾&#x1f339;&#xff1a;Linux权限&#xff08;超详细彻底搞懂Linux的权限&#xff09; &#x1f516;流水不争&#xff0c;争的是滔滔…

华为的USG6000为什么不能ping通

前言&#xff1a; 防火墙usg6000v的镜像 链接: https://pan.baidu.com/s/1uLRk0-hnHRTLYLx1Pnplow?pwdtymp 提取码: tymp 看了好多毒文章&#xff0c;感觉写作业更有意思&#xff0c;可以了解新的知识 内容&#xff1a; 首先看毒文章是这样说的&#xff0c;华为的防火墙是…

【Linux】实战小项目-----Bash的简易版

目录 一、什么是Bash 二、实现Bash&#xff1a; 1、整体需求分析&#xff1a; 2、初始化&#xff1a; 3、分割字符串&#xff1a; 4、执行普通命令&#xff1a; 5、内建命令与特殊处理&#xff1a; 1、ls的颜色&#xff1a; 2、内建命令cd&#xff1a; 3、export&#…

windows文件下换行, linux上不换行 解决CR换行符替换为LF notepad++

html文件是用回车换行的&#xff0c;在windows电脑上&#xff0c;显示正常。 文件上传到linux服务器后&#xff0c;文件不换行了。只有一行。而且相关js插件也没法正常运行。 用notepad查看&#xff0c;显示尾部换行符&#xff0c;是CR&#xff0c;这就是原因。CR是不被识别的。…

汽车产业数字化转型:协同创新破解挑战,平衡安全与流通

在数字经济时代的浪潮中&#xff0c;数据资源和数据信息已成为驱动各行各业转型升级的“新石油”。汽车产业&#xff0c;作为国民经济的重要支柱&#xff0c;正经历着前所未有的变革。随着数字化创新和转型的深入&#xff0c;数据在汽车全产业链中的作用和价值日益凸显。在这个…

C语言程序设计P5-2【应用函数进行程序设计 | 第二节】——知识要点:函数的参数及返回值和函数的调用及声明

知识要点&#xff1a;函数的参数及返回值和函数的调用及声明 视频&#xff1a; 目录 一、任务分析 二、必备知识与理论 三、任务实施 一、任务分析 1.求x的n次方的值也就是求n个x的乘积&#xff0c;可把x和n作为函数的形参&#xff0c;定义一个函数power来完成这个功能&am…

40分钟学 Go 语言高并发:GRPC框架使用

gRPC框架使用 一、gRPC基础知识 知识点说明重要程度应用场景RPC原理远程过程调用的基本原理⭐⭐⭐⭐⭐分布式系统通信协议设计Protocol Buffers的使用⭐⭐⭐⭐⭐接口定义、数据序列化服务定义gRPC服务和方法定义⭐⭐⭐⭐服务接口设计性能优化连接池、压缩、流式处理⭐⭐⭐⭐高…

HTML Input 文件上传功能全解析:从基础到优化

&#x1f90d; 前端开发工程师、技术日更博主、已过CET6 &#x1f368; 阿珊和她的猫_CSDN博客专家、23年度博客之星前端领域TOP1 &#x1f560; 牛客高级专题作者、打造专栏《前端面试必备》 、《2024面试高频手撕题》 &#x1f35a; 蓝桥云课签约作者、上架课程《Vue.js 和 E…

【ETCD】【源码阅读】ETCD启动流程源码解读

启动流程的图如下&#xff1a; 1、主函数入口 ETCD 启动的入口在 etcd/server/main.go 文件中。 package mainimport ("os""go.etcd.io/etcd/server/v3/etcdmain" )func main() {etcdmain.Main(os.Args) }这里调用了 etcdmain.Main()&#xff0c;这是 …

【RBF SBN READ】hadoop社区基于RBF的SBN READ请求流转

读写分离功能的背景及架构 当前联邦生产集群的各个子集群只有Active NameNode在工作,当读写任务变得繁忙的时候,只有一个Active负责处理的话,此时集群的响应和处理能力业务侧感知会明显下降,为此,我们将引入Observer架构,实现读写功能的分离,使得Active只负责写请求,而…

计算机运行时提示错误弹窗“由于找不到 quazip.dll,无法继续执行代码。”是什么原因?“quazip.dll文件缺失”要怎么解决?

计算机运行时错误解析&#xff1a;解决“quazip.dll缺失”问题指南 在软件开发和日常计算机使用中&#xff0c;我们经常会遇到各种运行时错误。今天&#xff0c;我们将深入探讨一个常见的错误提示&#xff1a;“由于找不到quazip.dll&#xff0c;无法继续执行代码。”这一弹窗…

NuHertz/HFSS: 使用矩形、径向和阻抗短截线的平面 LPF 切比雪夫-II 实现

我们今天的主题是使用 NuHertz 和 HFSS 设计 Microstrip Lowpass Chebyshev-Type2 滤波器。切比雪夫 2 型在通带中具有平坦的响应&#xff0c;在阻带中具有波纹。我们将比较 NuHertz 中的不同选项。 低通滤波器由集总 L 和 C 组件制成。这种方法很难用于高频应用程序。高频滤波…

SpringBoot整合knife4j,以及会遇到的一些bug

这篇文章主要讲解了“Spring Boot集成接口管理工具Knife4j怎么用”&#xff0c;文中的讲解内容简单清晰&#xff0c;易于学习与理解&#xff0c;下面请大家跟着小编的思路慢慢深入&#xff0c;一起来研究和学习“Spring Boot集成接口管理工具Knife4j怎么用”吧&#xff01; 一…

高效的 Java 对象映射库“Orika”

什么是 Orika Orika 是一个高效的 Java 对象映射库&#xff0c;专门用于简化 Java 应用程序中对象之间的转换。它以自动化和优化的方式将一个对象的属性映射到另一个对象&#xff0c;从而减少了手动编写重复代码的需要。Orika 特别适合处理复杂的对象结构以及数据传输对象 &am…

汽车总线协议分析-CAN-FD总线

随着汽车功能的增多&#xff0c;各ECU之间的信息交互也越来越频繁&#xff0c;导致总线负载持续走高&#xff0c;CAN2.0报文只有约40%-50%带宽实际用于数据传输&#xff0c;响应机制易受车内布线的物理特性限制&#xff0c;如广播延迟、导线延迟等&#xff0c;CAN的局限性也逐渐…

【JavaEE】多线程(6)

一、用户态与内核态 【概念】 用户态是指用户程序运行时的状态&#xff0c;在这种状态下&#xff0c;CPU只能执行用户态下的指令&#xff0c;并且只能访问受限的内存空间 内核态是操作系统内核运行时的状态&#xff0c;内核是计算机系统的核心部分&#xff0c;CPU可以执行所有…