面壁智能发布端侧 AI 应用开发平台;快手推出肖像动画技术 LivePortrait丨 RTE 开发者日报

news2024/11/15 7:51:46

在这里插入图片描述

开发者朋友们大家好:

这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

本期编辑:@JLT,@鲍勃

01 有话题的新闻

1、快手科技团队推出 AI 肖像动画技术 LivePortrait

快手科技团队推出 LivePortrait,这是一种基于隐式关键点框架的高效肖像动画技术。它能从单张源图像和驱动视频生成生动的视频,展现出优秀的泛化能力、可控性和效率。

研究者通过扩大训练数据集、采用混合训练策略、升级网络架构等方法提升了生成质量。LivePortrait 在 RTX 4090 GPU 上每帧仅需 12.8 毫秒,效果媲美扩散模型方法。该项目的推理代码和模型已开源。(@AI 科技评论)

2、面壁智能发布端侧 AI 应用开发平台 MobileCPM

借助阿里云在 WAIC 2024 期间举办的论坛,面壁智能发布了一个叫 MobileCPM 的套件平台,开发者可以通过这一平台提供的 SDK 套件「一键开发基于端侧大模型的 App」,面壁智能首席科学家刘知远在发布会中称,该平台接入了「非常多端侧通用模型」。

面壁智能此前已发布多款适用于小型智能设备的端侧小模型。6 月 11 日的苹果开发者大会上,苹果提出 Apple Intelligence 概念,将未来用户在端侧体验到的 AI 解决方案划分为端侧和云端两层,其中云端接入 GPT 等第三方模型,端侧主要使用苹果自研的小模型。

面壁智能 CEO 李大海对「新皮层」称,未来端侧模型是外部厂商提供还是设备厂商自己做是个开放性问题,目前「大家还在探索」,而作出高品质的端侧模型并不是简单的事,如果设备厂商选择自研,意味着他们也要像国内第一梯队的基础大模型初创公司那样配备「100 人起,核心至少也得大几十人」的 AI 团队。(@新皮层 NewNewThing)

3、支付宝推出「碰一下」支付新方式,无需展示付款码即可完成支付

在支付宝开放日上,支付宝宣布升级条码支付体验,推出「支付宝碰一下」,用户无需展示付款码,解锁手机碰一下商家收款设备,最快一步完成支付。

官方表示,相比已有的支付宝「扫一下」,「碰一下」更加简单直接。「碰一下」和「扫一下」都属于条码支付,区别在于「扫一下」使用了手机上的显示屏和摄像头,「碰一下」使用了手机上的近场通信技术,在使用上述传感器完成交互后,支付在网络端完成,两者具有同等安全性。同时支付宝依旧承诺「你敢付我敢赔」。(@爱范儿)

4、腾讯智影小程序上线 AI 视频功能,日漫风格功能限时免费

腾讯智影小程序上线了智影 AI 视频功能,可以一键生成风格化视频,目前有日漫风格可选,此功能限时免费(未公布收费价格)。视频风格化就是在原视频的基础上进行风格化处理,官方称风格化视频可以提升视频美感、增强趣味性、提升传播力。只需导入视频并一键「变身」,就能快速生成风格化视频(支持 10s 视频),智影 AI 提供了多种模板,让视频更加多样化。

据 IT 之家此前报道,腾讯智影上线于 2023 年 3 月,是一款集成了 AI 创作能力的智能创作工具,提供虚拟数字人、文本配音、智能去水印、文章转视频、模板创作、在线视频剪辑等功能。(@IT 之家)

5、苹果首款支持 Apple Intelligence 的智能家居设备将是一款桌面机器人

7 月 8 日消息,苹果备受期待的「Apple Intelligence」功能今年晚些时候将首先登陆 iPhone、iPad 和 Mac 设备,而包括 HomePod 智能音箱、Apple Watch 手表和 Vision Pro 头显等产品将暂时无缘这个功能,其中也包括备受关注的新版 Siri 语音助手。

现据彭博社记者马克・古尔曼 (Mark Gurman) 透露,苹果首款搭载 Apple Intelligence 功能的智能家居设备将是一款全新的桌面机器人。

古尔曼表示,期待在现有苹果智能家居设备上使用 Apple Intelligence 功能的用户可能要失望了,他们需要等待苹果推出 AI 驱动的桌面机器人产品。早在今年 4 月,古尔曼就首次曝光了苹果的机器人项目,其中桌面机器人是开发进度最快的项目之一,但仍处于早期阶段。(@IT 之家)

02 有态度的观点

1、红杉美国合伙人:AI 不会取代软件,而是带来新的商业模式和机会

AI 技术正处于转折点,将创造新商业模式和机会,特别是在服务行业,如法律和会计等领域,这些行业的文本处理工作流程非常适合 AI 技术应用。稳定的基础 AI 模型对整个 AI 生态系统发展至关重要,这种稳定性支持企业更有效地预测和构建应用程序,推动工程化优化和认知架构设计。尽管 AI 将带来新的服务模式,人际关系和实际执行任务将继续依赖人工,不会被 AI 完全取代。(@有新 Newin)

2、Anthropic 首席执行官:未来三年内,AI 大模型训练成本将上升至百亿甚至千亿美元

7 月 8 日消息,据外媒报道,AI 初创公司 Anthropic 的首席执行官 Dario Amodei 近期接受播客节目采访时表示,目前像 GPT-4o 这样的模型训练成本约为 1 亿美元,而目前正在开发的 AI 大模型训练成本可能高达 10 亿美元(约 72.94 亿元人民币)。当然,10 亿美元还不是「终点」。Dario Amodei 作出预测,未来三年内,AI 大模型的训练成本将上升至 100 亿美元甚至 1000 亿美元(约 7294.28 亿元人民币)。Dario Amodei 还谈到了对通用人工智能(AGI)的看法:AGI「不会突然实现」,而是一个渐进的发展过程。新的模型建立在过去的模型的发展之上,就像人类孩童不断学习新知识。

报道称,若 AI 模型算力每年增长 10 倍,那么也可以据此推测训练模型所需的硬件也至少强大 10 倍。因此,硬件很可能是训练 AI 模型中最大的成本驱动因素。早在 2023 年,ChatGPT 就需要超过 30000 个 GPU,而 OpenAI 首席执行官阿尔特曼也曾证实,训练 GPT-4 的成本为 1 亿美元。(@凤凰科技)

写在最后:

我们欢迎更多的小伙伴参与 「RTE 开发者日报」 内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。

在这里插入图片描述

素材来源官方媒体/网络新闻

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1910855.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C# Winform自制多轴力臂(简单易懂,方便扩展)

WinForms框架广泛应用于上位机开发领域,其中对力臂的精准控制是常见需求之一。本文深入探讨了如何创建自定义的多轴力臂图形控件,不仅涵盖了力臂图形控件的角度调节机制,还详细展示了如何实现力臂运动的生动动态效果,为开发者提供…

AE-时间轴的基础操作

目录 预览(快捷键空格) 调整时间线显示比例(Alt鼠标滚轮) 控制预览长度(B/N) 逐帧移动(笔记本:按住fn上下方向键) 视频剪切(ctrlshiftD) 剪…

“El-Table二次封装“这样做【高级前端必备技能之一】

🔥 前言 这篇文章给大家分享一个高级自定义列表组件从0到1的开发过程,这个列表组件的主要功能有,列表拖拽排序,右侧操作按钮统一使用Tooltip展示,操作表头增加自定列表icon,点击icon可以对列表展示数据进行…

帮企建站包响应式建站源码系统 带完整的安装代码包以及搭建部署教程

系统概述 帮企建站包响应式建站源码系统是一款为企业和个人提供便捷、高效建站解决方案的工具。它融合了先进的技术和设计理念,旨在帮助用户轻松构建具有专业水准的网站,无论在桌面端还是移动端都能呈现出完美的展示效果。 该系统基于响应式设计原则&a…

怎么制作gif动图,视频制作GIF动画更简单

在社交媒体和网络交流中,GIF动画以其生动活泼的表现形式成为了表达情感、幽默和创意的热门媒介。无论是分享日常趣事,还是制作专业演示,一个恰到好处的GIF动图总能吸引目光,传递信息。 但你知道吗?即使没有专业的设计背…

有什么好的录屏软件?分享4款好评的软件!

在数字化时代,录屏软件已成为我们工作、学习和娱乐中不可或缺的工具。但面对市场上琳琅满目的录屏软件,我们该如何选择最适合自己的那一款呢?今天,就让我们一起来揭秘那些备受好评的录屏神器,帮助你轻松找到录屏的首选…

Stable Diffusion——如何把雪碧变成了一个小女孩?

引言 Stable Diffusion WebUI是一个基于深度学习的图像生成工具,它可以将一张图片转换成另一种模样。通过使用先进的稳定扩散算法,这个工具能够生成高质量、高分辨率的图像,同时保持原始图像的核心特征。无论您是想将照片转换成艺术作品&…

7成期刊下降!今年的影响因子为何如此凄惨?

2024年6月20日科睿唯安发布了JCR 2023,21800本期刊最新影响因子正式更新,附完整版EXCEL下载。 影响因子 影响因子(Journal Impact Factor,简称JIF或IF)是由科睿唯安每年发布的期刊引证报告(Journal Citati…

python——list

在Python中,list是一种非常灵活的数据结构,可以用来存储一系列的元素。这些元素可以是任何类型,包括数字、字符串、其他列表等,并且它们不需要是同一种类型。 列表特征: 以下是一些关于Python列表的基本操作&#xff…

书生大模型实战营(暑假场)-入门岛-第一关

书生大模型实战营暑假场重磅开启!,这场学习路线看起来很好玩呀,闯关学习既能学到知识又有免费算力可得,太良心啦。感兴趣的小伙伴赶快一起报名学习吧!!! 关卡任务 好的,我们废话不多…

论文总是写不好?这么向kimi提问再试试!【图文大全套】

学境思源,一键生成论文初稿: AcademicIdeas - 学境思源AI论文写作 你是否有这样的困惑:论文为什么总是达不到预期的高标准?写作过程中总感觉缺乏方向和灵感?在文献搜索和数据分析上耗费了大量时间却收获甚微&#xff…

老师怎样提高学生的听课效率?

在课堂上,我们常常面临一个问题:如何提高学生的听课效率?这是一个让无数教师头疼的问题。学生是否全神贯注,是否能够吸收和理解课堂上的知识,这直接关系到教学的成败。那么,作为教师,我们能做些…

敏捷的两种方式:Kanban和 Scrum

敏捷方法通过提供灵活、迭代的项目管理方法,改变了软件开发。敏捷方法中最著名的框架是 Kanban 和 Scrum。虽然这两种方法都旨在提高生产力和效率,但它们的运作原则和实践却截然不同。 在本文中,我们将深入探讨 Kanban 和 Scrum 的起源、主要…

简过网:备考一级造价师工程师,到底要不要报个培训班?

最近,小编刷到了有很多朋友在备考一级造价师,其中要不要报个培训班引想了小编的注意,今天,针对备考一级造价师工程师,到底要不要报个培训班这个问题,小编给大家一块来了解一下。 ​ 备考一级造价师工程师要…

侯捷C++面向对象高级编程(上)-10-组合与继承

1.复合-介绍 2.复合-适配 3.复合-计算 4.复合-构造和析构 5.委托 6.继承-介绍 7.继承-构造和析构

【数据结构】TreeMap及TreeSet

欢迎浏览高耳机的博客 希望我们彼此都有更好的收获 感谢三连支持! 一、概念 TreeMap和TreeSet都是Java中基于红黑树(Red-Black tree)实现的有序集合类。它们分别实现了SortedMap和SortedSet接口,因此提供了按照键(对…

8.2结构体的定义和使用

代码 #include <iostream> using namespace std; #include <string>//1、创建学生数据类型&#xff1a;学生包括(姓名&#xff0c;年龄&#xff0c;分数) //自定义数据类型&#xff0c;一些类型集合组成一个类型 //语法 struct 类型名称{成员列表} struct Stduent…

ClickHouse 更新操作导致不可写,应该选择哪种表引擎?

一个工作日下午&#xff0c;某大型通信运营商业务人员报告&#xff0c;一套 ClickHouse 集群在进行插入数据操作的时候&#xff0c;系统报错 too many mutations(1036)&#xff0c;插入数据失败&#xff01; 作者&#xff1a;张宇&#xff0c;爱可生DBA&#xff0c;负责数据库运…

【问题记录】VsCode中以管理员权限运行Powershell

问题展示 今天在尝试运行nodemon命令的时候出问题&#xff0c;显示没法识别&#xff0c;经过分析发现是管理员权限的问题&#xff0c;由于是在vscode里面进行开发&#xff0c;因此特此进行配置。 方法一 直接在vscode命令行中输入如下命令&#xff1a; Start-Process powers…

MySQL--视图和用户管理

视图 这里的视图跟之前事务里面的read view没有任何关系。 视图是一个虚拟表&#xff0c;其内容由查询定义。同真实的表一样&#xff0c;视图包含一系列带有名称的列和行数据。视图的数据变化会影响到基表&#xff0c;基表的数据变化也会影响到视图。 创建视图 create view 视…