AI日报:北大Open Sora视频生成更强了;文心一言可以定制你自己的声音;天工 SkyMusic即将免费开放;

news2024/10/6 16:21:12

图片

🤖📱💼AI应用

北大Open Sora视频生成更强了!时长可达10秒,分辨率更高

图片

【AiBase提要:】

⭐️ Open-Sora-Plan v1.0.0模型发布 显著提升视频生成质量和文本控制能力

⭐️ 支持华为昇腾910b芯片,提升运行效率和质量。

⭐️ 该模型能够生成10秒、24FPS的1024×1024高清视频,同时还支持生成高分辨率图像

项目地址:https://top.aibase.com/tool/open-sora-plan

文心一言APP上线定制专属声音功能

图片

【AiBase提要:】

⭐ 文心一言APP——选择创建智能体——创建我的声音,2秒打造专属定制声音

⭐ 在与智能体的每一次对话中,都可以使用自己合成的音色进行语音播报。

⭐ 还可以点击通话按钮,与你自己构建的数字分身实时对话

产品入口:https://top.aibase.com/tool/wenxinyiyan

Midreal AI互动小说游戏网页版本更新

图片

【AiBase提要:】

⭐ Midreal AI互动小说游戏推出全新网页版本,无需在Discord平台操作

⭐ 网页版本的Midreal每一句话都可以生成对应的图片,支持视频小说制作

⭐ 更新为SD模型,图像质量更高,更遵循指令,逻辑也更强

产品入口:https://top.aibase.com/tool/midreal-ai

昆仑万维:天工 SkyMusic AI音乐生成大模型4月17日正式上线免费开放

图片

【AiBase提要:】

⭐ 昆仑万维开发的AI音乐生成大模型「天工SkyMusic」将于4月17日正式上线免费开放。

⭐ 用户可以利用该应用将灵感转化为动听的歌曲,即使是零基础的用户也可以享受音乐创作的乐趣。

⭐ 使用「天工SkyMusic」创作音乐的步骤包括下载应用、写歌词、选择参考歌曲和分享作品。

内测地址:https://top.aibase.com/tool/tiangongskymusic

音乐圈的Sora要来了?AI音乐应用xgboost曝光 据说比Suno好10倍!

图片

【AiBase提要:】

⭐ 博主@maxescu对参与内测的AI音乐应用xgboost评价极高,认为将划时代。

⭐ @maxescu表示这款AI音乐应用要比Suno好10倍,期待值达顶点。

⭐ 该AI音乐应用生成的音乐几乎与Spotify的歌曲无区别,让人震惊。

网易AI音乐网易天音开启内测 仅白名单用户可用

图片

【AiBase提要:】

⭐ 网易天音是全新AI音乐创作工具,集成编曲、作词和歌曲创作功能。

⭐ 内测阶段仅限白名单用户使用,旨在收集反馈优化产品。

⭐ 工具提供丰富指南和快速开始教程,支持AI编曲和一键写歌功能。

产品入口:https://top.aibase.com/tool/wangyitianyin

Tara:一款可以将大模型哦接入Comfy UI的插件

图片

【AiBase提要:】

⭐️ 可以将大型语言模型(LLM)接入到Comfy UI中

⭐️ 通过简单的设置API,将节点用于优化提示词等工作

⭐️ TaraDaisyChainNode节点实现了复杂工作流程,方便操作优化等

项目地址:https://top.aibase.com/tool/tara

Hand Talk:利用AI自动将文本和音频翻译成手语

图片

【AiBase提要:】

🤖 应用由人工智能驱动,自动翻译文本和音频成手语,服务全球4. 66 亿聋人和重听人士。

🌐 提供自动手语翻译功能和虚拟翻译者Hugo和Maya,帮助学习和交流更互动。

📚 除翻译外,还有学习和教育工具,支持个性化和互动功能,让交流更便捷和有趣。

官网:https://top.aibase.com/tool/hand-talk

下载地址:https://www.handtalk.me/en/app/

📰🤖📢AI新鲜事

ChatGPT 将提供动态模式Dynamic 可根据情况自动选择适合用户的模型

【AiBase提要:】

⭐ 系统将根据智能、能力和速度综合情况,自动选择最适合用户要求的模型。

⭐ Claude的新工具"Tool use"可以同时调用多个模型解决问题,具有灵活性和适应性。

⭐ ChatGPT的"Dynamic"功能和Claude的"Tool use"代表了AI技术的智能化、自动化进步。

认为GPT-4推理能力为0开发者悬赏1万美金被打脸

【AiBase提要:】

⭐️ 一名开发者认为GPT-4没有推理能力,悬赏1万美金挑战

⭐️ 网友用高能prompt让GPT-4几乎达到100%正确率

⭐️ Claude-3Opus展现惊人计算能力,成功率达到56%

详细内容:https://www.chinaz.com/2024/0408/1608624.shtml

OpenAI计划建立「数据市场」,训出GPT-5短缺20万亿 token

【AiBase提要:】

⭐️ 数据供不应求可能导致人工智能发展受阻

⭐️ 公司探索合成数据训练方法以解决数据短缺问题

⭐️ OpenAI计划建立「数据市场」来解决数据短缺问题,训练下一代强大模型

亚马逊线下店AI训练失败:依赖千名审核人员手动审核

【AiBase提要:】

⭐ 亚马逊原计划实现无需收银员的“拿货即走”技术,但AI训练失败。

⭐ 亚马逊改为购物车模式,提供更便捷购物体验。

⭐ 亚马逊通过生成式AI功能帮助卖家创新,简化列表创建流程。

苹果斥资5000万美元授权数百万张Shutterstock图片用于训练AI模型

【AiBase提要:】

⭐ 苹果与Shutterstock达成协议,授权数百万张图片训练AI模型

⭐ 苹果预计花费5000万美元,类似谷歌、Meta和亚马逊的协议

⭐ 苹果计划在WWDC大会上宣布加入更多AI技术至操作系统中

商汤科技提出FouriScale 无需训练,生成高分辨率图像

图片

【AiBase提要:】

⭐ 扩散模型逐渐超越GAN和自回归模型,成为生成式模型主流选择。

⭐ FouriScale通过空洞卷积和低通滤波操作实现不同分辨率下的图像生成。

⭐ 实验结果表明,FouriScale在生成高分辨率图像方面取得显著提升。

项目地址:https://top.aibase.com/tool/fouriscale

论文地址:https://arxiv.org/abs/2403.12963

Fireworks.ai开源API使任何开发者都能使用生成式AI

【AiBase提要:】

⭐️ Fireworks开源API帮助开发者快速添加生成式AI功能,降低成本。

⭐️ Fireworks允许用户尝试多个模型,快速适应业务用例。

⭐️ CEO曾在Meta工作,带领AI平台团队,获得 2500 万美元融资。

Fireworks 入口:

https://top.aibase.com/tool/fireworks-ai

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1577808.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

如何实现OpenHarmony的OTA升级?

OTA简介 随着设备系统日新月异,用户如何及时获取系统的更新,体验新版本带来的新的体验,以及提升系统的稳定性和安全性成为了每个厂商都面临的严峻问题。OTA(Over the Air)提供对设备远程升级的能力。升级子系统对用户…

麻了,一面就这么难

总体而言,整个过程更看你回答的条理与深度,不太需要面面俱到,有自己的理解和思考反而会加分,不需要每道题都回答得百分百,有些问题属于面试官顺带提一嘴,但重点问题要答好。 一面 介绍下项目,因…

《最佳实践之》GPS NMEA-0183 协议, 解析 $GPRMC 协议

一,了解 GPS NMEA-0183 协议 需要基础物联网对接知识,需要对解析协议有一定认识。 如果不知道怎么连接硬件,请看我的另一篇博客:https://blog.csdn.net/Crazy_Cw/article/details/126613967 这篇文章只说明,如何解析协…

AI编程案例002/ 根据草图设计小红书封面

之前看OpenAI发布会,给个草图能设计个网站。 今天试了一下,给ChatGpt一个封面的设计草图,让ChatGpt编程实现一个拼图封面。 需求如下: 上传四张图片图片按草图排列成不同的布局,每一种布局是一个封面。下面草图的布…

Godot 常用UI+布局容器简单介绍

文章目录 前言相关链接Canvasitem:画布Control:UI布局基类Container:布局容器基类AspectRatioContainer:伸缩居中布局BoxContainer:盒子布局ColorPicker:取色器 CenterContainer:不伸缩居中FlowContainer&a…

软件设计师:下午题(试题三)历年真题

2021年下半年 2021年上半年 2020年下半年 2019年下半年 2019年上半年 2018年下半年 2018年上半年 2017年下半年 后续知识引入 2017年上半年 2016年下半年 2016年上半年 2015年下半年 2015年上半年 2014年下半年 2014年上半年 2013年下半年 2013年上半年 2012年下半年 2012年…

Flink运行机制相关概念介绍

Flink运行机制相关概念介绍 1. 流式计算和批处理2. 流式计算的状态与容错3. Flink简介及其在业务系统中的位置4. Flink模型5. Flink的架构6. Flink的重要概念7. Flink的状态、状态分区、状态缩放(rescale)和Key Group8. Flink数据交换9. 时间语义10. 水位…

给他个卖票的机会,他能卖出负数票. 多线程安全问题演示

文章目录 1.1 线程安全产生的原因注意 : 以上代码是有问题 , 接下来继续改进通过上述代码的执行结果 , 发现了出现了负号票 , 和相同的票 . 说明数据出现安全问题 1.2 线程的同步1.3 同步代码块1.4 同步方法1.5 Lock锁 1.1 线程安全产生的原因 多个线程在对共享数据进行读改写…

关系(三)利用python绘制相关矩阵图

关系(三)利用python绘制相关矩阵图 相关矩阵图(Correlogram)简介 相关矩阵图既可以分析每对变量之间的相关性,也可以分析单变量的分布情况。相关性以散点图的形式可视化,对角线用直方图/密度图表示每个变量…

MySQL 底层数据结构 聚簇索引以及二级索引 Explain的使用

数据结构 我们知道MySQL的存储引擎Innodb默认底层是使用B树的变种来存储数据的 下面我们来复习一下B树存储 B树存储 哈希存储的区别 哈希存储,只能使用等值查询 B树与B树存储 我们知道B树实际上就是B树的变种 那么为啥使用B树而不是使用B树呢? 我们知道效率的高低主要取决于…

【JavaScript】作用域和闭包

作用域 作用域是程序源代码中定义的范围。JavaScript采用词法作用域,也就是静态作用域。所谓词法作用域就是在函数定义的时候就已经确定了。 let value 1 function foo(){console.log(value) } function bar(){let value 2foo() } bar() // 1变量对象是当前代码…

2.基础乐理-唱名的来历,简谱的构造

前置内容:1.唱名与记住唱名的方法 唱名的来历: 很久很久以前(公元前)各个文明开始诞生和慢慢发展,随着文明的发展,各个文明都开始出现自己的音乐,根据考古学家的发现在 公元前1800年&#xff…

【随笔】Git 高级篇 -- 整理提交记录(下)rebase(十六)

💌 所属专栏:【Git】 😀 作  者:我是夜阑的狗🐶 🚀 个人简介:一个正在努力学技术的CV工程师,专注基础和实战分享 ,欢迎咨询! 💖 欢迎大…

每日汇评:地缘冲突休战会阻碍黄金创纪录的涨势吗?

尽管以色列与哈马斯的地缘政治紧张局势有所缓和,金价仍冲破 2350 美元,创下新高; 对央行黄金购买量激增的预期抵消了美国非农就业数据主导的美联储强硬押注; 在美国CPI数据公布之前,由于 RSI 极度超买,金价…

YOLOV8注意力改进方法: CoTAttention(Visual Question Answering,VQA)附改进代码)

原论文地址:原论文下载地址 论文相关内容介绍: 论文摘要翻译: 具有自关注的Transformer导致了自然语言处理领域的革命,并且最近在许多计算机视觉任务中激发了具有竞争性结果的Transformer风格架构设计的出现。然而,大…

day02php环境和编译器—我耀学IT

一、环境介绍 1、web 环境 使用 PHP 需要先安装环境,安装环境比较麻烦,需要安装Web服务、PHP应用服务器、MySQL管理系统。 Web服务:apache 和 nginx PHP:多版本 MySQL:多版本 2、环境集成包 因为多环境、多版本、多系…

查看Linux系统相关信息

注: 本文只是博主学习记录分享,仅供参考。如有错误肯定是博主理解有问题,谢谢! 一、查看当前操作系统的内核信息 命令:uname -a 二、查看当前操作系统版本信息 命令:cat /proc/version 这条命令可以查看到…

什么是电子邮件加密?电子邮件加密有几种类型?

在当今数字时代,电子邮件已经成为人们日常生活中不可或缺的沟通工具,据相关数据统计,全球每天发送的电子邮件数以亿计,而这些邮件里面通常包含了姓名、地址、个人身份信息 (PII)、登录凭证、财务信息、法律合同、知识产权等有价值…

Python学习从0到1 day22 第二阶段 面向对象 ⑤ 多态

诋毁本身就是一种仰望 —— 24.4.8 学习目标 1.理解多态的概念 2.理解抽象类(接口的编程思想) 多态 多态,指的是:多种状态,即完成某个行为时,使用不同的对象会得到不同的状态 多态常用在继承关系上 比如&am…

从事「音视频领域」开发工作有前途吗?

据我所知,做音视频的也分算法和工程,这两者都比普通开发高出不少,音视频工程开发的薪资大概比普通web开发高出30%。在开始前我有一些资料,是我根据网友给的问题精心整理了一份「音视频开发的资料从专业入门到高级教程」&#xff0…