2024世界人工智能大会,神仙打架

news2024/10/6 8:37:24
  • B站:啥都会一点的研究生
  • 公众号:啥都会一点的研究生

AI圈最近又发生了啥新鲜事?

该栏目以周更频率总结国内外前沿AI动态,感兴趣的可以点击订阅合集以及时收到最新推送

B站首秀世界人工智能大会,展示自研AI技术与AIGC创意

在2024年世界人工智能大会期间,B站展示了其自主研发的多项AI技术成果和AIGC多元创意。B站称每月有超过8000万用户观看AI相关视频,其中60%为00后,成为AI行业厂商首选的沟通平台。AI自研技术不仅提升了UP主的创作能力,还为用户提供更沉浸式的体验,如必剪Studio的1:1真人模型定制服务和AI动态漫技术。此外,B站首次展出了自研的Index-1.9B系列大语言模型,支持知识问答、文案创作等应用,赋能UP主创作并推动AI技术生态发展

https://tech.caijing.com.cn/20240705/5022474.shtml

支付宝发布国内首批多模态医疗大模型,支持千亿级视觉识别

在2024世界人工智能大会上,支付宝正式发布了其多模态医疗大模型,成为国内首批此类模型之一。该模型基于蚂蚁百灵的多模态技术,能直接理解并训练音频、视频、图像和文本等多类型数据,具备千亿级别参数的医疗视觉识别能力。在测试中,模型对诊疗报告、医学药品和毛发状况等的识别准确率达到90%以上,表现媲美甚至超越GPT4在中英文医疗考试及基准测试中的成绩

https://www.tmtpost.com/nictation/7156616.html

阿里达摩院发布“寻光”:一站式AI视频创作平台

在2024世界人工智能大会期间,阿里达摩院推出了一款名为“寻光”的一站式AI视频创作平台。该平台旨在简化视频创作流程,提高创作效率,集成了从剧本创作到分镜设计、再到视频素材编辑等关键步骤,使创作者能够在单一平台上完成从创意构思到成品视频的全过程。寻光平台的功能包括故事板生成、角色定制、视觉素材的自由创作和视频内容的可控编辑,支持对AI生成素材和实拍素材进行各种编辑操作

https://www.ithome.com/0/780/117.htm

李彦宏:没有应用,基础模型一文不值,商业化闭源模型最能打

百度创始人李彦宏在2024世界人工智能大会上表示,在激烈竞争的环境下,商业化的闭源模型因其性能优势更胜一筹。他强调,没有实际应用支撑的基础模型价值有限,呼吁业界应更重视AI应用的开发而非单纯追求模型的更新和升级。百度正转型为人工智能优先的企业,用文心大模型重构其To C和To B业务。李彦宏认为,AI应用应避免追求单一的“杀手级”应用,而应重视对产业和应用场景的增益

https://www.thepaper.cn/newsDetail_forward_27959166

傅盛:付费的闭源大模型才是智商税

猎豹移动董事长兼CEO、猎户星空董事长傅盛在2024世界人工智能大会期间,对“开源大模型是智商税”的说法提出了反驳。傅盛认为,大模型的开源与闭源并不是核心问题,真正的智商税体现在收取高昂的模型授权费和API费用的闭源大模型上。开源大模型在性能上已经足够优秀,许多企业都在免费使用,而那些需要用户每月支付数十元才能使用的闭源大模型才是在征收智商税。傅盛强调,要有效利用大模型,关键在于结合企业实际,实现应用层面的落地,单纯选择模型而不注重应用的开发,即便免费也无法发挥应有的效果

https://www.tmtpost.com/nictation/7158129.html

丘成桐:人工智能要重视上游的基础学科

在2024年世界人工智能大会暨人工智能全球治理高级别会议全体会议上,菲尔兹奖首位华人得主丘成桐强调了基础学科,尤其是数学,在人工智能领域的重要作用。丘成桐指出,人工智能的上游、中游、下游应同步发展,其中上游的基础学科需发挥领导作用,中下游则需提供支持。虽然上游工作短期内不易见到成果,但长远来看,美国近期在大模型上的突破正是多年持续投入基础研究的结果。丘成桐还强调,中国拥有优秀的数学学生,应在人工智能上游工作上充分利用这批人才资源,推动数学等基础学科与人工智能的深度融合

https://www.yicai.com/news/102178152.html

中国科学院院士王坚:美国AI发展的电力瓶颈在中国不成问题

在2024世界人工智能大会上,中国工程院院士、阿里云创始人王坚表示,电力供应不会成为中国AI发展的瓶颈,而这是美国AI发展中面临的一大短板。王坚指出,中国的年发电量远超美国、日本和俄罗斯三国总和,电力供应充足。他进一步提出,应用、模型、电力和算力之间存在着一种不等式关系,基于这一关系,当前AI领域从业者无需过分担忧电力与算力的瓶颈

https://news.mydrivers.com/1/989/989658.htm

特斯拉二代人形机器人Optimus在WAIC上亮相,行走速度提升30%

在2024世界人工智能大会上,特斯拉展示了其第二代人形机器人Optimus的最新进展。相较于前代,Optimus的行走速度提高了30%,展现出更为流畅和高效的移动能力。这一提升表明特斯拉在人形机器人技术领域持续取得突破,Optimus的性能正在逐步完善,朝着更加实用和高效的方向发展

https://www.cnstock.com/commonDetail/208386

商汤发布首个可控人物视频生成大模型Vimi

在2024年世界人工智能大会上,商汤推出首个面向消费者市场的可控人物视频生成大模型Vimi,荣获大会“镇馆之宝”称号。能够通过一张任意风格的照片生成与目标动作一致的人物视频,支持多样化驱动方式,如人物视频、动画、声音和文字。解决了市场上人物视频生成技术的多个痛点,如表情控制不精准、效果不稳定和视频时长受限等问题。该模型特别设计以满足女性用户和视频创作者的需求,提供多种风格和场景选择,如自拍、唱歌、舞蹈等

https://www.lieyunpro.com/archives/493614

商汤发布日日新5.5大模型体系

商汤发布日日新5.5大模型体系,包括6000亿参数基础模型日日新5.5,性能提升30%;流式多模态交互模型日日新5o,是国内首个所见即所得模型,可进行实时多模态交互和问答;日日新5.5Lite在端侧模型进行升级,模型精度提升10%、首包延迟降低40%,推理效率提升15%

https://www.cls.cn/detail/1724446

世界知识产权组织:过去十年中国生成式AI专利申请量居全球第一

世界知识产权组织发布《生成式人工智能专利态势报告》。报告显示,2014年至2023年,中国发明人申请的生成式人工智能专利数量最多,远超美日韩等国。2014年至2023年,全球生成式人工智能相关的发明电请量达54000件,其中超过25%是在去年一年出现的

https://news.cctv.com/2024/07/03/ARTIeCZeKCiTAjBHzSmxfDkS240703.shtml

微软 Copilot for Microsoft 365 将迎新功能,设计、写作全面赋能

微软近期公布了其备受关注的智能协助手 Copilot for Microsoft 365 的一系列即将于7月上线的新功能,进一步加强了该服务在微软旗下众多软件产品中的整合力度。备受期待的一项更新是将微软的人工智能艺术创作工具"设计器(Designer)"引入 Word 和 PowerPoint 应用。用户只需打开 Copilot 并通过文字指令描述需求,copilot 就能自动生成图像

https://www.ithome.com/0/778/676.htm

比尔·盖茨:Scaling Law快要走到尽头,超人AI还需新的突破

比尔·盖茨在一期 Next Big ldea 播客中讨论了人工智能的未来发展,强调其在医疗、教育和生产力中的重要性。他认为AI将深刻影响合成生物学和机器人技术,并预测个人智能体会通过耳机、眼镜等设备与人类交互。盖茨指出AI的真正进步在于实现更接近人类的元认知能力,而非仅扩大模型规模。他预期AI将提升生产率并改善生活质量但也提醒需警惕技术发展对社会的影响

https://mp.weixin.qq.com/s/lzX6JpBLUmF_FSwlwEIfjQ

苹果公开演示其“4M”人工智能模型

苹果与瑞士洛桑联邦理工学院(EPFL)在Hugging Face平台上发布了一款名为“4M”的人工智能模型的公开demo。该4M(大规模多模态掩码建模)模型能够跨多种模态处理和生成内容,例如从文本创建图像、识别物体,以及使用自然语言输入操纵三维场景

尽管微软和谷歌等公司因他们的人工智能合作和产品而频频占据新闻头条,但苹果一直在稳步提升其人工智能能力。4M模型的公开展示表明,苹果正将其自身定位为人工智能行业的重要参与者

https://venturebeat.com/ai/apple-just-launched-a-public-demo-of-its-4m-ai-model-heres-why-its-a-big-deal/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1905161.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

springboot配置扫描生效顺序

文章目录 举例分析项目结构如下noddles-user-backend 两个配置文件noddles-user-job 配置文件noddles-user-server 配置文件问题:server和Job启动时对应加载的数据库配置为哪一个? 总结 在微服务架构中,backend模块会定义一个基础的配置文件,…

Python网络爬虫:Scrapy框架的全面解析

Python网络爬虫:Scrapy框架的全面解析 一、引言 在当今互联网的时代,数据是最重要的资源之一。为了获取这些数据,我们经常需要编写网络爬虫来从各种网站上抓取信息。Python作为一种强大的编程语言,拥有许多用于网络爬虫的工具和库…

永磁同步电机无速度算法--滑模观测器(反正切、反余弦)

一、原理介绍 在永磁同步电机滑模观测器控制中,转子的位置和转速信息与反动电势密切相关。滑模观测器控制基本设计思路是:利用永磁同步电机的电压、电流信息,通过永磁同步电机数学模型,估算出电机在两相静止坐标系中的反电动势信…

鸿蒙NEXT不再支持安卓这条路真的走的通吗?

前言 看到高赞又是一片嘲讽,“apk换种打包方式”等等轻松拿几百赞,我也是无语。 国内多家互联网大厂都已经启动HarmonyOS Next应用开发,预计明年正式上线,如今业内很多人都已经知道了。 网络上相关报道也有很多,新浪…

[数据结构] 归并排序快速排序 及非递归实现

()标题:[数据结构] 归并排序&&快速排序 及非递归实现 水墨不写bug (图片来源于网络) 目录 (一)快速排序 类比递归谋划非递归 快速排序的非递归实现: (二)归并排序 归…

antdesignvue对话框用户可移动并缩放

原贴 轻松搞定Ant Design Modal对话框拖拽缩放 - ByteZoneX社区https://www.bytezonex.com/archives/IFRuoJhd.html Ant Design 模态对话框:实现拖拽缩放功能 **子 Ant Design 是一个流行的前端 UI 框架,提供了一系列实用的组件,包括模态对…

数据结构——二叉树相关题目

1.寻找二叉树中数值为x的节点 //寻找二叉树中数值为x的节点 BTNode* TreeFind(BTNode* root, BTDataType x)//传过来二叉树的地址和根的地址,以及需要查找的数据 {if (root Null){return Null;}//首先需要先判断这个树是否为空,如果为空直接返回空if (…

Linux下fcitx框架输入法输入中文标点时为半角(英文)标点符号的解决

目录 引入解决1.打开fcitx设置2.打开全局配置3. 随便找个可以输入地方敲下快捷键 总结 本文由Jzwalliser原创,发布在CSDN平台上,遵循CC 4.0 BY-SA协议。 因此,若需转载/引用本文,请注明作者并附原文链接,且禁止删除/修…

RNN 交叉熵

RNN善于处理时序 序列数据 简单RNN 展开就是 LSTM 遗忘门f_t决定上期记忆保留多少 隐藏层 在神经网络中,隐藏层指的是除了输入层和输出层之外的层,它们的输出不会直接用于网络的最终输出,而是作为中间步骤用于提取和转换数据。因此&#x…

构件软件开发-系统架构师(二十五)

1、一路和二路公交车都将在10分钟随机到达同一车站,他们相隔四分钟的概率是()。 A0.36 B0.48 C0.64 D0.76 解析: 如果把x为1路,y为2路,则x-y4,y-x4 所以可以得到坐标 (4,0)(10,6)(0,4)(6,1…

(ECCV,2022)Mask-CLIP:从CLIP中提取自由密集标签

文章目录 Extract Free Dense Labels from CLIP相关资料摘要引言方法Mask-CLIPMask-CLIP 实验 Extract Free Dense Labels from CLIP 相关资料 代码:https://github.com/chongzhou96/MaskCLIP 论文:https://arxiv.org/abs/2112.01071 摘要 对比语言-…

PyVideoTrans:一款功能全面的视频翻译配音工具!【送源码】

PyVideoTrans是一款功能全面的视频翻译配音工具,专为视频内容创作者设计。它能够将视频中的语言翻译成另一种语言,并自动生成与之匹配的字幕和配音。支持多种语言,包括但不限于中文(简繁体)、英语、韩语、日语、俄语、…

算法010:无重复字符的最长子串

无重复字符的最长子串. - 备战技术面试?力扣提供海量技术面试资源,帮助你高效提升编程技能,轻松拿下世界 IT 名企 Dream Offer。https://leetcode.cn/problems/longest-substring-without-repeating-characters/ 使用的算法:滑动窗口 在这个…

apk反编译修改教程系列-----修改apk 解除软件限制功能 实例操作步骤解析_3【二十二】

在前面的几期博文中有过解析去除apk中功能权限的反编译步骤。另外在以往博文中也列举了修改apk中选项功能权限的操作方法。今天以另外一款apk作为演示修改反编译去除软件功能限制的步骤。兴趣的友友可以参考其中的修改过程。 课程的目的是了解apk中各个文件的具体作用以及简单…

C-11 三角剖分的调研

C-11 三角剖分算法 三角剖分就是将输入的多边形,分割成一系列互不重叠的三角形,其重要性就在这不多赘述。这个是一个别人总结的链接:http://vterrain.org/Implementation/Libs/triangulate.html 图片链接:http://www-cgrl.cs.m…

STM32点灯闪烁

stm32c8t6引脚图 开发板引脚图 GPIO端口的每个位可以由软件分别配置成 多种模式。 ─ 输入浮空 ─ 输入上拉 ─ 输入下拉 ─ 模拟输入 ─ 开漏输出 ─ 推挽式输出 ─ 推挽式复用功能 ─ 开漏复用功能 配置GPIO端口步骤:开启时钟->使用结构体设置输出模式…

Android项目中,查看项目依赖树的多种方式

1.使用预设的Task来进行查看 1.1 命令行 查看某个模块的所有依赖树: gradlew [模块名称]:dependencies 例如:gradlew app:dependencies查看某个模块的某功能的依赖树: gradlew [模块名称]:dependencies --configuration [功能名称] 例如&…

国内采用docker部署open-metadata

背景 最近看看开源的元数据管理项目,比较出名点的有open-metadata、datahub、OpenLineage、atlas。 open-metadata有1千多的贡献者,4.8K的stars,社区现在也比较活跃,支持的数据库类型还蛮多,基本市面上常见的都有支持…

C++ 函数高级——函数的占位参数

C中函数的形参列表里可以有占位参数,用来做占位,调用函数时必须填补改位置 语法: 返回值类型 函数名(数据类型){ } 在现阶段函数的占位参数存在意义不大,但是后面的课程中会用到该技术 示例:…

离线开发(VSCode、Chrome、Element)

一、VSCode 扩展 使用能联网的电脑 A,在VSCode官网下载安装包 使用能联网的电脑 A,从扩展下载vsix扩展文件 将VSCode安装包和vsix扩展文件通过手段(u盘,刻盘 等)导入到不能联网的离线电脑 B 中 在离线电脑 B 中安装…