AI日报:百度发布文心大模型学习机;Open-Sora 1.1可生成21秒视频;Canva可以自动剪辑视频了;超牛ComfyUI节点AnyNode来了

news2024/11/19 5:33:58

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:AIbase - 智能匹配最适合您的AI产品和网站

1、百度文心大模型学习机“小度学习机Z30”发布

这篇文章介绍了百度旗下的小度科技推出的首款基于文心大模型的学习机Z30,旨在重新定义AI老师,通过先进的AI技术助力孩子主动学习,同时让家长享受全陪伴的超省心体验。该学习机拥有出色的视觉体验和多项先进技术,以及针对多个学习环节的全面重构,提供科学、高效的学习方案。AI老师能够提供丰富的教育内容,支持多轮交互和个性化定制,让学习更加生动有趣和高效有针对性。

image.png

【AiBase提要:】

📚 小度Z30学习机采用文心大模型技术,逼真还原课文情景,帮助孩子更好地理解和掌握知识。

👩‍🏫 小度Z30支持AI师生互动课和课后个性化练习,量身定制学习计划,实现全科全学段的随时答疑。

💡 AI老师基于文心知识增强的大模型,为孩子提供权威且丰富的教育内容,支持多模态感知和拟人化呈现,让学习更加生动有趣。

2、Open-Sora 1.1发布 视频质量提升,生成时长延长至21秒

Open-Sora1.1发布带来了显著提升,尤其在视频生成质量和时长方面。新版本模型能生成最长约21秒视频,使用高质量视觉数据和字幕训练,提升对世界运作的理解。CausalVideoVAE架构优化提高性能和推理效率。

image.png

【AiBase提要:】

🚀 视频生成质量和时长提升: 新版本能生成最长约21秒视频,通过高质量视觉数据和字幕训练,提升对世界运作的理解。

🔍 高质量视觉数据和字幕训练: 使用更高质量的视觉数据和字幕进行训练,增强模型对世界运作的理解。

⚙️ CausalVideoVAE架构优化: 优化后的架构提高了视频生成的性能和推理效率,与Sora基础模型性能相似。

详情链接:Open-Sora-Plan-v1.1.0使用入口地址 Ai模型最新工具和软件app下载

在线体验地址:https://huggingface.co/spaces/LanguageBind/Open-Sora-Plan-v1.1.0

3、Canva上线多个好用功能:文本生成插画、自动剪辑视频精华片段

Canva设计平台最新更新旨在提升专业团队和工作空间的吸引力,包括重新设计平台、推出企业版、提供AI风格匹配功能等。更新内容涵盖多项功能和改进,使设计工作更高效便捷。

image.png

【AiBase提要:】

🎨 Canva推出企业版,提供更多协作和安全性控制。

🌟 新增AI风格匹配功能,定制工作区显示文件夹。

💡 Canva Docs推出建议模式和彩色突出显示块,提供编辑建议和强调文本区域。

4、超牛ComfyUI节点AnyNode来了!要啥功能让AI帮你编写

AnyNode是ComfyUI中一个令人印象深刻的新节点,利用了大型语言模型(LLMs)的能力,允许用户通过输入提示词来创建具有特定功能的节点。它为用户提供了在ComfyUI中进行多样化操作的工具,极大地扩展了用户在创建自定义节点和工作流时的可能性。对于希望实现高级功能和自动化任务的用户来说,无疑是一个宝贵的资源。

作者发布的视频教程

【AiBase提要:】

🔑 功能编写: 用户可以根据要求编写Python函数,实现任何功能。

🔧 灵活性: 用户可以通过提示词让LLM帮助编写不同类型的节点,如文本总结、颜色通道调整、Ins滤镜效果等。

🔗 与ComfyUI的兼容性: AnyNode作为ComfyUI中的节点,可以与其他节点配合使用,链接到所需的输出格式节点。

详情链接:https://top.aibase.com/tool/anynode

5、ChatTTS:一个专为对话场景设计的语音生成模型

ChatTTS是一个专为对话场景设计的语音生成模型,支持中文和英文,通过大量数据训练,提供高质量和自然度的语音合成。项目团队计划开源一个基础模型,注重模型的可控性和安全性。用户在使用ChatTTS时需注意免责声明,开源模型将为社区带来新的学习和创新机会。

image.png

【AiBase提要:】

🔑 应用场景广泛:ChatTTS适用于大型语言模型助手的对话任务、对话语音和视频介绍,提供自然流畅的交互体验。

🔑 多语言支持:模型支持中文和英文,跨越语言障碍,服务于更广泛的用户群体。

🔑 开源计划:团队计划开源一个基础模型,促进学术界和开发者社区的研究和开发。

详情链接:https://www.bilibili.com/video/BV1zn4y1o7iV/

项目地址:ChatTTS使用入口地址 Ai模型最新工具和软件app下载

6、视频修复项目ProPainter发布Comfyui节点

这篇文章介绍了ComfyUI_ProPainter_Nodes项目,它是一个专门针对视频修复的解决方案,基于ProPainter框架并实现了ComfyUI界面。该项目提供了高级视频帧编辑和无缝的视频修复任务,为视频编辑和修复领域带来了强大的工具。

image.png

【AiBase提要:】

🔧 基于ProPainter框架,提供高级视频帧编辑和无缝的视频修复任务。

🎨 提供视频修复节点,包括ProPainter节点和ProPainter Outpainting节点。

📚 提供详细的安装说明、工作流程示例和推荐节点,丰富的输入参数和节点参考信息。

详情链接:https://top.aibase.com/tool/comfyui-propainter-nodes

7、AI可以生成手语手势视频了!SignLLM通过文字描述即可生成手语视频

SignLLM是一项创新的多语言手语模型,为听力障碍者提供了重要的沟通工具,推动了人工智能在语言理解和生成领域的研究。它通过文字描述生成手语视频,促进信息的无障碍交流。

image.png

【AiBase提要:】

🤖 文本到手语视频转换:SignLLM模型能将文本转化为手语手势视频,直观易懂。

🌍 支持多种手语:包括美国手语(ASL)、德国手语(GSL)等八种手语,适用性广泛。

📊 首创多语言手语数据集:引入Prompt2Sign数据集,对模型训练和发展至关重要。

详情链接:https://top.aibase.com/tool/signllm

8、降噪黑科技Look Once to Hear!只需看一眼说话的人 除了他以外的声音就消失了

这篇文章介绍了一种先进的降噪耳机技术“Look Once to Hear”,通过用户的视觉输入来控制声音的放大或消除。这项技术在嘈杂环境中提供了专注和便利,让用户能够清晰听到目标说话者的声音。可能结合了人工智能、机器学习和声音处理算法,对听力障碍者尤其有用。

image.png

【AiBase提要:】

👀 视觉控制: 用户只需短暂看向想要聆听的说话者,耳机便能识别并放大该说话者的声音。

🌆 环境适应性: 适用于嘈杂环境,帮助用户在街道、咖啡馆等场合中清晰听到目标说话者的声音。

🚶 移动中使用: 即使用户在移动中,耳机能持续追踪并播放目标说话者的语音,提供专注和便利。

详情链接:https://top.aibase.com/tool/lookoncetohear

9、Meta被曝使用Instagram等照片训练AI模型引发隐私争议

这篇文章揭露了Meta利用Instagram和Facebook用户照片训练AI模型的隐私争议。用户隐私受到严重侵犯,数据隐私搜集条例被严重违反。Meta声称用户可以退出数据搜集模式,但之前搜集的数据仍可能保存在AI模型中,引发关注和担忧。在数据隐私和保护方面,企业应加强合规措施,确保用户个人信息得到妥善处理和保护。

【AiBase提要:】

📷 Meta使用用户照片训练AI模型,违反数据隐私搜集条例

🔍 用户隐私受到侵犯,引发广泛关注

❌ 用户可以退出数据搜集模式,但之前搜集的数据仍可能保存在AI模型中

10、比对口型还牛!InstructAvatar:实现文字生成指定面部的表情和动作

InstructAvatar 是一项最新的对话形象生成模型,通过文本引导方法实现了对情感和面部动作的细粒度控制,提升了虚拟形象的互动性和泛化能力。该模型在细粒度情感控制、口型同步质量和自然性方面优于现有方法,能指定面部的表情和动作,为生成具有情感表达的2D虚拟形象带来了突破性进展。

image.png

【AiBase提要:】

👄 InstructAvatar 实现了对情感和面部动作的细粒度控制,提升了虚拟形象的互动性和泛化能力。

😊 实验结果显示,InstructAvatar 在细粒度情感控制、口型同步质量和自然性方面优于现有方法,能指定面部的表情和动作。

🎭 InstructAvatar 的框架包括变分自动编码器(VAE)和基于扩散模型的动作生成器,通过自然语言界面实现了对生成视频的细粒度控制。

详情链接:https://top.aibase.com/tool/instructavatar

11、马斯克的 xAI 融资 60 亿美元,估值达 240 亿美元

Elon Musk的xAI公司在B轮融资中成功筹集了60亿美元,使公司估值达到240亿美元。该公司致力于开发先进的人工智能系统,旨在为全人类提供真实、有能力且最大限度有益的AI技术。最新融资将用于推出首个产品、建设先进基础设施,并加速未来技术的研发。

【AiBase提要:】

💰 xAI公司在B轮融资中筹集了60亿美元,估值达240亿美元

🚀 最新融资将用于推出首个产品、建设先进基础设施,并加速未来技术的研发

🤖 xAI正在开发先进的人工智能系统,旨在为全人类提供真实、有能力且最大限度有益的AI技术

12、苹果的“Greymatter 项目”将是普通用户在日常中可使用的AI工具

苹果将在即将到来的WWDC上展示其最新的人工智能进展,重点放在普通用户可以在日常生活中使用的AI工具上。新计划名为“Project Greymatter”,将整合AI工具到主要应用中,并改进操作系统通知功能。苹果的AI策略是追赶竞争对手,利用用户基础和隐私品牌形象继续引领市场。

【AiBase提要:】

🔍 苹果将在WWDC展示最新的人工智能进展,专注于普通用户可用的AI工具。

🛠 苹果计划将AI工具整合到主要应用中,改进操作系统通知功能。

💬 苹果与OpenAI合作开发聊天机器人,但不会在WWDC展示,而是作为插件显示在iOS18中。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1710286.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

半导体测试基础 - 功能测试

功能测试(Functional Test)主要是验证逻辑功能,是运用测试矢量和测试命令来进行的一种测试,相比于纯 DC 测试而言,组合步骤相对复杂且耦合度高。 在功能测试阶段时,测试系统会以周期为单位,将测试矢量输入 DUT,提供预测的结果并与输出的数据相比较,如果实际的结果与测…

【探索Java编程:从入门到入狱】Day6

🍬 博主介绍👨‍🎓 博主介绍:大家好,我是 hacker-routing ,很高兴认识大家~ ✨主攻领域:【渗透领域】【应急响应】 【Java、PHP】 【VulnHub靶场复现】【面试分析】 🎉点赞➕评论➕收…

轻松实现PDF文件的在线浏览

福昕软件最近发布了一款名为Cloud API的产品,通过几行代码即可轻松实现PDF文件的在线浏览。先一睹为快吧。 简介 先看看产品官网:福昕 Cloud API Cloud API包括两个形态产品,一个是在线的PDF查看工具,叫PDF Embed API,另外一个…

TensorRT部署模型基本步骤(C++)

TensorRT部署模型基本步骤(C) 文章目录 TensorRT部署模型基本步骤(C)前言一、onnx模型转engine1.基于C代码生成engine2.基于trtexec.exe命令行生成 二、读取本地模型三、创建推理引擎四、创建推理上下文五、创建GPU显存缓冲区六、…

Offline RL : Context-Former: Stitching via Latent Conditioned Sequence Modeling

paper 基于HIM的离线RL算法,解决基于序列模型的离线强化学习算法缺乏对序列拼接能力。 Intro 文章提出了ContextFormer,旨在解决决策变换器(Decision Transformer, DT)在轨迹拼接(stitching)能力上的不足…

windows11如何安装IIS

目录 IIS是什么? 为什么要配置IIS? 1.打开控制面板进入程序 2.点击启用或者关闭windos功能 3.勾选IIS相关的web项 4.点击确定等待一分钟程序变更即可 5.主页搜索internet 点击进入 6.进入IIS进行查看配置,并测试,也可以浏…

43、Flink 的 Window Join 详解

1.Window Join a)概述 Window join 作用在两个流中有相同 key 且处于相同窗口的元素上,窗口可以通过 window assigner 定义,并且两个流中的元素都会被用于计算窗口的结果。 两个流中的元素在组合之后,会被传递给用户定义的 Joi…

stream-实践应用-统计分析

背景 业务部门提供了一个数据,数据甚至不是excel类型的,是data.txt,每一行都是一个数据,需要对此数据进行统计分析 统计各个月份的销量 因为直接获取resources下的data.txt,所以要借助输入流进行获取数据,再…

sqli-labs---第三关

1、判断什么类型注入 ?id1 正常显示 ?id1 (报错:1) LIMIT 0,1) ?id1 正常显示 ?id1#(报错:1) LIMIT 0,1) 可知闭合方式为) 2、查看列数 ?id1) order by 3 -- (没有报错) ?id1) order by 4 -- (报错) 说明有3列 3、使用联合查…

Scrapy框架简单介绍及Scrapy项目编写详细步骤(Scrapy框架爬取豆瓣网站示例)

引言 Scrapy是一个用Python编写的开源、功能强大的网络爬虫框架,专为网页抓取和数据提取设计。它允许开发者高效地从网站上抓取所需的数据,并通过一系列可扩展和可配置的组件来处理这些数据。Scrapy框架的核心组成部分包括: Scrapy Engine&…

window本地部署Dify

Dify与之前的MaxKB不同,MaxKB可以实现基础的问答以及知识库功能,但是如果要开发一个Agent,或者工作流就还是需要额外开发,而Dify 是一个开源 LLM 应用开发平台。其直观的界面结合了 AI 工作流、RAG 管道、代理功能、模型管理、可观…

python制作一个批量更新文件名称的工具

新书上架~👇全国包邮奥~ python实用小工具开发教程http://pythontoolsteach.com/3 欢迎关注我👆,收藏下次不迷路┗|`O′|┛ 嗷~~ 目录 一.前言 二.实现 三.使用效果 一.前言 随着数字化时代的到来,文件管理和处理变…

14.微信小程序之地理定位功能

目录 1.地理定位介绍 1.1 申请开通 1.2 使用方法 2.拒绝授权后的解决方案 3.开通腾讯位置服务 4.LBS 逆地址解析 1.地理定位介绍 小程序地理定位是指通过小程序开发平台提供的 API,来获取用户的地理位置信息。用户在使用小程序时,可以授权小程序获…

【LabVIEW FPGA入门】同步C系列模块

1.同步使用循环定时器VI计时循环速率的系列模块 数字模块SAR ADC 模块多路复用模块 数字通道可以在一个时钟周期内执行。模拟通道需要多个时钟周期。 同步模拟模块的每个通道有一个 ADC,采集的数据在通道之间没有明显的偏差。多路复用模块使用多路复用器通过单个 A…

解决:error: failed to push some refs to ‘https://gitee.com/***/***.git‘(高效快速)

解决方案: git pull --rebase origin master 具体原因: 主要原因是gitee(github)中的README.md文件不在本地代码目录中 要执行git pull --rebase origin master命令将README.md拉到本地 然后就可以执行git push啦 写在最后: 要是问题得到…

MySQL简单测试和安装

MySQL 的特点 1、MySQL 性能卓越、服务稳定,很少出现异常宕机。 2、MySQL开放源代码且无版权制约,自主性及使用成本低。 3、MySQL历史悠久(版本众多),用户使用活跃,遇到问题可以寻求帮助。 4、MySQL体积小(相对大型关系型数据库)…

你还不知道宠物空气净化器的五大好处?难怪家里总有异味和猫毛!

养猫是一件非常令人愉快的事情,猫咪的陪伴能带给我们无尽的欢乐。然而,随着时间的推移,许多养猫的朋友会发现一个问题,那就是家中的猫毛和异味问题。其实,解决这些问题的关键就在于选择一款高效的宠物空气净化器。今天…

嵌入式学习——3——多点通信

1、套接字选项(socket options) int getsockopt(int sockfd, int level, int optname, void *optval, socklen_t *optlen); int setsockopt(int sockfd, int level, int optname, const void *optval, socklen_t optlen); 功能:获取或设置套接…

二叉树——基础知识详解

前言: 经过前面的学习,我们接下来要开始二叉树的学习,因二叉树有难度,为了方便讲解以及各位的理解,本节知识会分成不同的小节进行学习,在本阶段只学习初阶的二叉树(堆,二叉数基本知识…

多分支拓扑阻抗匹配

最近测试信号质量,发现在有过冲、振铃等问题的时候大部分硬件工程师喜欢直接调大匹配电阻或者减小驱动电流,虽然这种操作是有效果的,但是我认为应该还可以更严谨的计算下,而不是选几个电阻多次尝试,显得不是很专业。 …