【AI】行业消息精选和分析(23-11-19)

news2024/11/19 14:26:08

行业动态

1、对标GPTs,微软连夜发布100多项更新!微软CEO:Copilot时代来了
2、英伟达联手微软推出AI代工服务
3、全新雅虎搜索将于 2024 年上线,未来还会推出更多 AI 和高级功能
4、Instagram 推出定制 AI 贴纸和滤镜功能,强化创作者体验
5、OPPO正式推出自主训练大模型AndesGPT
6、原阿里首席 AI 科学家贾扬清再发声:开源领域“魔改”要不得
7、滴滴组建大模型团队,将落地部分个人出行和企业差旅场景
8、小米 Vela 开源系统正式发布:8KB 内存就能跑,支持端侧 AI 大模型
9、金山办公昨日宣布,WPS AI 开启公测,面向全体用户陆续开放体验。
10、人人都有专属数字家庭医生 浙江数字健康人“安诊儿”来了

技术发展

🤖 DeepMind的Mirasol3B模型:
- 更有效地理解和分析视频中发生的事情,即使视频很长。
- 独特的多媒体处理:同步和非同步文本分析。
- 视听与文本关系理解:提高长视频分析效率。


🎥 Meta AI的Emu Video和Emu Edit:
- Emu Video:文本到视频的生成,高质量视频制作。
- Emu Edit:图像编辑的指令驱动模型,精确像素修改。
- 技术创新:两个扩散模型生成高分辨率视频。

当地时间11月16日,Meta于官网发布文生视频模型Emu Video和图像编辑模型Emu Edit。
据介绍,Emu Video可以通过自然语言生成高质量视频,它将视频生成分为两个步骤,首先生成以文本为条件的图像,然后生成以文本和生成的图像为条件的视频。Emu Edit是一个多任务图像编辑模型,可以通过自然语言对图像进行编辑。在训练中,团队将区域编辑、自由格式编辑和计算机视觉任务等均制定为生成任务,并为其提供了学习任务嵌入。


🌐 screenshot-to-code项目:
- GPT-4V驱动:将屏幕截图转化为HTML网页。


👤 微软的Deepfakes Creator:
- 仅需文本输入就可生成逼真的会说话的真人视频
- 支持多种语言,还可进行实时问答互动


🎶 Deepmind与YouTube的Lyria音乐生成模型:
- 只要哼唱或者吹口哨就能帮你自动生成交响乐
- 歌词创作和风格控制:艺术家风格模仿。
- 特色:生成音频带AI水印。

谷歌DeepMind宣布与YouTube合作推出AI音乐生成大模型Lyria,并基于该模型推出两个功能:Dream Track、Music AI。Dream Track可以自动生成模仿某音乐人声音、风格音乐,用户只需输入文字提示,选择需要模仿的音乐人,便可以自动生成包含歌词的30秒音乐。
Music AI可以将用户哼唱的旋律变成完整的曲目,创建乐器和声乐伴奏等。此外,基于Lyria模型发布的任何内容都将带有Synth ID水印。

🏪 GPTs Store界面曝光:GTPs导航站可能会被取代?
- 精选GPT:展示本周精选GPTs。
- 热门GPT:社区中受欢迎的GPTs。
- 特色和趋势:当前列表为空


🎨 Meshy-1:3D模型生成AI工具:
- 多样输入:文本和图像到3D模型转换。
- 风格多样:现实、动漫、卡通等风格选择。
- 格式支持:多种文件格式,包括Unity插件。
- 高清纹理:提供4K分辨率PBR纹理。
 

今日感受

1.魔改开源大模型,以零一修改张量名字为典型案例,开始被开源社区、大厂抵制。这将导致社会资源的大量浪费和损失。

2.多模态AI时代就要来了。

单模态AI的能力是有限的,比如只能通过文本或者图像来理解或者输出内容。如今,单模态数据在实际应用中存在局限性,需要采用多模态 AI。

举个例子,一辆只有摄像头系统的自动驾驶汽车很难在弱光下识别行人。如果加上激光雷达、雷达和 GPS 就可以完美解决这些问题,可以为车辆提供更全面的周围环境图像,从而使驾驶更安全、更可靠。

和自动驾驶一样典型的案例,就是医疗。我们都知道,中医有“望闻问切”,西医讲究“视触叩听”,异曲同工,并且是典型的多模态应用。

多模态才更符合人类的真实世界。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1225926.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【教3妹学编程-算法题】三个无重叠子数组的最大和

2哥 : 3妹,咋啦?一副苦大仇深的样子? 3妹:不开心呀不开心,羽生结弦宣布离婚。 2哥 : 羽生什么? 3妹:羽生结弦! 2哥 : 什么结弦? 3妹:羽生结弦!&am…

战神传奇【我本沉默精修版】win服务端+双端+充值后台+架设教程

搭建资源下载:战神传奇【我本沉默精修版】win服务端双端充值后台架设教程-海盗空间

安卓手机投屏到电视,跨品牌、跨地域同样可以实现!

在手机网页上看到的视频,也可以投屏到电视上看! 长时间使用手机,难免脖子会酸。这时候,如果你将手机屏幕投屏到大电视屏幕,可以减缓脖子的压力,而且大屏的视觉体验更爽。 假设你有一台安卓手机,…

TG Pro v2.87(mac温度风扇速度控制工具)

TG Pro 是适用于 macOS 的温度和风扇速度控制工具,可让您监控 Mac 组件(例如 CPU 和 GPU)的温度和风扇速度。如果您担心 Mac 过热或想要手动调整风扇速度以降低噪音水平,这将特别有用。 除了温度和风扇监控,TG Pro 还…

解锁数据安全之门:探秘迅软DSE的文件权限控制功能

企业管理者在进行数据安全管控时通常只关注到文件的加密方式,却忽略了以下问题:对于企业内部文档,根据其所承载的涉密程度不同,重要程度也不相同,需要由不同涉密等级的的人员进行处理,这就需要对涉密文档和…

JVM 调优指南

文章目录 为什么要学 JVM一、JVM 整体布局二、Class 文件规范三、类加载模块四、执行引擎五、GC 垃圾回收1 、JVM内存布局2 、 JVM 有哪些主要的垃圾回收器?3 、分代垃圾回收工作机制 六、对 JVM 进行调优的基础思路七、 GC 情况分析实例 JVM调优指南 -- 楼兰 ​ JV…

参考文献格式

目录 期刊会议预印本(如arxiv) 期刊 找不到页码可以在文献中查看bibtex格式,其中有 外文期刊可在web of science中查找卷号、期号和所在页数: [1] ZHANG F, HU Z Q, FU Y K, et al. A New Identification Method for Surface …

详解Java设计模式之职责链模式

原文:详解Java设计模式之职责链模式_java_脚本之家 责任链模式是一种行为设计模式,使多个对象都有机会处理请求,从而避免请求的发送者和接收者之间的耦合关系,文中通过代码示例给大家介绍的非常详细,需要的朋友可以参考下 − 目…

传奇手游白日门【龙城霸业】win服务端+双端+GM后台+详细教程

搭建资源下载地址:传奇手游白日门【龙城霸业】win服务端双端GM后台详细教程-海盗空间

6.9平衡二叉树(LC110-E)

绝对值函数:abs() 算法: 高度和深度的区别: 节点的高度:节点到叶子节点的距离(从下往上) 节点的深度:节点到根节点的距离(从上往下) 逻辑:一个平衡二叉树…

Bert学习笔记(简单入门版)

目 录 一、基础架构 二、输入部分 三、预训练:MLMNSP 3.1 MLM:掩码语言模型 3.1.1 mask模型缺点 3.1.2 mask的概率问题 3.1.3 mask代码实践 3.2 NSP 四、如何微调Bert 五、如何提升BERT下游任务表现 5.1 一般做法 5.2 如何在相同领域数据中进…

C_11微机原理

一、单项选择题(本大题共 15 小题,每小题 3分,共45分。在每小题给出的四个备选项中,选出一个正确的答案。) .EXE 文件产生在()之后。 A.汇编 B. 编辑 C.用软件转换 D.连接 2,十进制-61的8位二进…

Dynamsoft Barcode Reader新框架将医疗视觉提升到新水平

Dynamsoft Vision 框架将医疗保健领域的计算机视觉提升到新的水平 引入图像捕获、内容理解、结果解析和交互式工作流程的聚合 SDK,以简化复杂的流程。 温哥华 – 2023 年 7 月 17 日 – Dynamsoft™ 发布了 Dynamsoft Barcode Reader SDK C Edition v10.0.0。更新…

Redis篇---第七篇

系列文章目录 文章目录 系列文章目录前言一、是否使用过 Redis Cluster 集群,集群的原理是什么?二、 Redis Cluster 集群方案什么情况下会导致整个集群不可用?三、Redis 集群架构模式有哪几种?前言 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分…

【算法挨揍日记】day31——673. 最长递增子序列的个数、646. 最长数对链

673. 最长递增子序列的个数 673. 最长递增子序列的个数 题目解析: 给定一个未排序的整数数组 nums , 返回最长递增子序列的个数 。 注意 这个数列必须是 严格 递增的。 解题思路: 算法思路: 1. 状态表⽰: 先尝试…

后端技术知识点内容-全部内容-面试宝典-后端面试知识点

文章目录 -2 flink-1 linux of viewlinux查看占用cup最高的10个进程的命令; 〇、分布式锁 & 分布式事务0-1分布式锁--包含CAP理论模型概述分布式锁:分布式锁应该具备哪些条件:分布式锁的业务场景: 分布式锁的实现方式有&#…

【linux】补充:高效处理文本的命令学习(tr、uniq、sort、cut)

目录 一、tr——转换、压缩、删除 1、tr -s “分隔符” (指定压缩连续的内容) 2、tr -d 想要删除的东西 ​编辑 3、tr -t 内容1 内容2 将内容1全部转换为内容2(字符数需要一一对应) 二、cut——快速剪裁命令 三、uniq——去…

【算法挨揍日记】day30——300. 最长递增子序列、376. 摆动序列

300. 最长递增子序列 300. 最长递增子序列 题目解析: 给你一个整数数组 nums ,找到其中最长严格递增子序列的长度。 子序列 是由数组派生而来的序列,删除(或不删除)数组中的元素而不改变其余元素的顺序。例如&#…

《2020年最新面经》—字节跳动Java社招面试题

文章目录 前言:一面:01、Java基础知识答疑,简单概述一下?02、倒排索引了解吗?使用Java语言怎么实现倒排?03、详细讲解一下redis里面的哈希表,常用的Redis哈希表命名有哪些,举例说明其…

酷柚易汛ERP - 盘点操作指南

1、应用场景 盘点功能是定期或临期对库存货物进行清点,使账面记录与实际库存相符合,从而随时掌握货物盈亏状态。 2、主要操作 2.1 盘点商品查询 打开【仓库】-【盘点】新增盘点单,筛选需要盘点的日期范围、库存及相应商品 2.2 录入盘点数…