科技云报道:人工智能“顶流”齐聚WAIC 2024,他们都做了什么?

news2025/2/24 1:39:00

科技云报道原创。

一个由智能驱动的未来世界长啥样?
在这里插入图片描述

从完成跨海跨城航线的“空中的士”、全无人驾驶汽车、实现奔跑功能的全尺寸通用人形机器人到百度文心一言、讯飞星火、阿里通义千问、华为盘古、商汤日日新等大模型,从智能制造引领的“灯塔工厂”到融入生活、人人可体验的智能应用,一个千帆竞渡、百舸争流的智能时代正缓缓向我们伸出触手,引领我们走向无限可能的未来。

7月4日,2024世界人工智能大会暨人工智能全球治理高级别会议(以下简称“WAIC 2024”)在上海启幕。

作为世界级AI科技盛会,本届大会以一场开幕式和三场全体会议——全球治理、产业发展、科学前沿为引领,全面覆盖AI伦理治理、大模型、数据、算力、具身智能、AI for Science、智慧工业、自动驾驶、投融资、教育与人才共十大重点话题,汇聚超过1000位全球领军人物,包括图灵奖、马尔奖、菲尔兹奖得主,科研机构、知名学者,世界500强企业代表等专家和行业人士,为人工智能技术的创新与发展注入新的活力。

当人工智能从“浅水区”迈向“深水区”,相关的研究理论出现分化与争议,研发投入与盈利能力之间的矛盾日益凸显,政、产、学、研各界正沿着不同的路径探索人工智能时代的未来。本届大会,蚂蚁集团、超云、智谱AI等国内AI领域“顶流”厂商业界全面展示了前沿技术研究和最新应用成果。

产业为根应用为锚人工智能触手可及

大会开幕当天,WAIC2024公布八大“镇馆之宝”,包括蚂蚁集团基于百灵大模型的“AI智能助理”、阿里云通义灵码、智谱AI基座大模型、联想集团笔记本YOGA Book 9i AI元启、商汤Vimi可控人物视频生成大模型 、特斯拉赛博越野旅行车 、智能飞行器展区展出的三家电动垂直起降航空器(eVTOL)创新产品。作为本届世界人工智能大会的展览最高荣誉,“镇馆之宝”旨在奖励并展示全球人工智能领域的最新技术成果、发展趋势及商业潜力。

在产业发展主论坛上,蚂蚁集团董事长兼CEO井贤栋表示,专业智能体能够破解通用大模型在严谨产业应用的关键难题,蚂蚁集团正在携手产业合作伙伴构建专业智能体生态,加速产业应用,推动服务升级。“在人工智能时代,我们也在探索,让AI像扫码支付一样便利每个人的生活,让AI技术发展的红利惠及更多人。”

通过科技的力量,降低人工智能应用门槛,实现人工智能技术普惠化,是蚂蚁集团一直以来的希望。作为国内较早布局AI大模型的厂商,蚂蚁自研的百灵大模型2023年已通过备案,并以此为内核打造了“三个管家”,分别是AI生活管家、AI金融管家和AI医疗健康管家。这三个管家对应的生活、金融和医疗等场景,都需要严谨专业优质的服务。

当前,通用大模型落地严谨产业面临着三个“能力短板”:领域知识相对缺乏、复杂决策难以胜任、对话交互不等于有效协同。井贤栋介绍,为了破解这些难题,蚂蚁选择了构建专业智能体生态的路径,“从我们的实践来看,专业智能体是大模型落地严谨产业的有效路径。”

由于垂直领域、高质量的数据往往以多种模态存在,对隐私保护和资产价值保护的要求高,很难直接“喂给”通用大模型。为此,蚂蚁依托知识图谱、密态计算等技术,构建了大规模专业知识引擎,可以将垂直领域不同类型的数据,抽象成不涉及隐私信息的领域知识,成为大模型的“专业教材”,供大模型训练学习,也能让大模型在推理中随时“查阅”。这些“专业教材〞,是蚂蚁提升大模型的领域专业性、打造专业智能体的核心能力。

其次,针对大模型复杂推理的能力短板,蚂蚁提出了FoE专家级决策框架(Framework of Experts),让智能体借鉴人类专家的思考方式,构建专业的推理和决策能力。严谨产业中存在大量的专业决策框架及公认的行业最佳实践,大模型要达到专业水准,必须谦虚地向专家学习。

作为生活服务的“数字接口”,AI智能助理成为专业智能体生态的平台入口。用户通过与智能助理的对话,就能一键连接生活、金融、医疗等垂直行业的AI智能体,获得更专业丰富的服务。

以投资研究智能体支小助为例,学习金融专家的分析推理框架后,在接到不同的投研任务时,它会动态学习专家的思考方式,模仿专家的思路进行分析和生成,可以实现媲美人类专家的金融分析能力,目前支小助已经为超百家金融机构提供服务,其服务水平已经趋近于真人行业专家,为用户在金融投资方面提供专业化决策。

在医疗健康领域,蚂蚁和浙江卫健委联合推出数字健康管家“安诊儿”,背后就是一个连接着多家医院、多个医疗机构的智能体生态。安诊儿的服务贯穿诊前、诊中、诊后,覆盖挂号、咨询、用药、健康科普等26个环节,用户通过语音就可以唤醒的专业智能体,能为患者就医提供诸如导诊挂号、问诊陪护、医疗报告查询、健康管理等专业服务,对老年人、异地就医群体尤其友好。今年,安诊儿将升级为2.0版本,真正带来全流程的就医智能体网络。

在“隐私计算:助力大模型与数据可信融合发展”分论坛上,蚂蚁集团联合中国电信集团有限公司、中国信息通信研究院华东分院、浙江大学区块链与数据安全全国重点实验室等国内外行业专家、学者,从技术前沿、标准体系、实践成果等维度,共话下一代隐私计算技术创新和应用。

大模型的发展不仅为密态计算带来了更大的市场空间,同时也在促进密态计算技术的不断演进。在论坛上,蚂蚁集团全新发布“隐语Cloud”大模型密态计算服务。该服务依托于蚂蚁全栈可信隐私计算技术,不仅提供了密态推理、密态微调等一站式服务,实现多重数据防御,全面适用于多种场景,从用户查询的隐私到训练数据的安全,再到模型IP的保护,使用户可以低成本、高效率地获得密算服务。

作为本届WAIC的重磅发布,蚂蚁集团首发了国内首个大模型安全一体化解决方案“蚁天鉴 2.0”。蚁天鉴是业内首个实现产业级应用的大模型安全评测与防御一体化解决方案,可保障大模型的生产和使用更加安全、可控、可靠。

相比1.0版本,蚁天鉴 2.0新增了两项评测能力,一个是“大模型X-ray”,可针对大模型的内在神经元进行X光扫描来做探查和判断,让研究人员了解大模型内部在发生什么、定位可能引发风险的神经元、并进行编辑修正,在模型内部治理幻觉,实现从源头识别和抑制风险。第二是“大模型基础设施评测”。从攻击者视角出发,深入扫描模型算法组件及模型软件系统,可及时准确发现大模型供应链及运行环境安全问题,保障云到端的应用安全可控。

面对新技术的滥用场景,蚁天鉴还推出了“AI鉴真”解决方案,支持多模态内容真实性和深度伪造检测,可快速精准鉴别图像、视频、音频、文本内容的真伪,有效应对AI换脸、声音模拟、证件伪造等各类深度伪造风险场景,图像识别准确率99.9%达到行业最高优秀级别。

在大会展区的蚂蚁集团“AI鉴真中心”,展出了包括多模态AI鉴真、“谍影重重”深度伪造(Deepfake)互动,为普通人揭开“声音模拟、AI换脸”的真相,让公众进一步了解到反深伪技术的发展,守护人们的安全。

该互动模拟了蚁天鉴AIGC检测和证照深度合成检测两大能力,对抗声音模拟、证件伪造等AI滥用风险场景的过程。“攻击端”模拟了常见伪造手法,涵盖证照、视频等多样化素材可供选择,可对“防御端”检测模型进行攻击。该产品依托生成模型构建TB级样本,实时攻防对抗,快速精准鉴别图像、视频、音频、文本内容的真伪并形成检测报告,从而帮助用户识别和评估相关素材是否被篡改或深度生成,防御AI技术的潜在滥用。同时,蚂蚁集团特设“谍影重重之 Deepfake 互动展”,用户上传一张照片就可以生成仿真视频。通过场景化的体验,让观众对人工智能安全有着更为直观的了解和认识。

算力为基大模型为擎,硬核技术异彩纷呈

在本届WAIC期间,智谱AI展示了最新的人工智能技术应用成果。自新一代基座大模型GLM-4问世以来,已经有超过30万个智能体活跃在清言的智能体中心内,其中包括了诸如思维导图、文档助手、日程安排等许多出色的生产力工具。这些智能体基于GLM模型自身强大的能力以及开发者的想象力,能够越来越高效和精准地帮助用户解决问题。

清言智能体不仅拥有1亿字庞大的知识库,支持文字、表格、音频等多种文件格式和URL导入,还能递归抓取信息,更配备了思维导图、流程图、高德地图、新浪微博、飞书日历、什么值得买、微信公众号等众多实用工具,与工作生活无缝对接,让AI从数字世界走向现实。

清言智能体大幅降低了人工智能工具的应用门槛,只需一键点击,便可轻松实现开箱即用,为用户工作生活带来更多便捷与创新。无论是有经验的开发者,还是不会编程的新手,都能通过简单的自然语言,让创建一个具备人设、能自主搜索、图文转化、运行代码、使用工具的智能体,不再是一个需要数周乃至数月的开发过程,而是在几分钟内就能实现简单AI实践。

人工智能技术的普及和应用,推动了算力需求的快速增长。传统的通用算力及信创算力已逐渐转向通用AI算力和自主AI算力,以适应更加复杂多样的应用场景。同时,算力空间的重构也呈现出新趋势,从分散的机房向枢纽节点的大规模投建转变,推动了AI推理业务从中心向边缘的拓展。

超云在AI算力基础设施方面的算力产品家族和一体化AI解决方案悉数亮相,为人工智能技术的广泛应用提供了有力支撑。

5月,超云发布“AI IN ALL”发展战略,其并非仅仅是硬件的简单堆砌,而是对研发设计、专业定制、多元生态、融合集成、供应能力以及整体解决方案能力的全面挑战与考验。此战略的核心在于构建一个全方位、一体化的AI解决方案体系,通过生态系统的深度融合与多方资源的协同合作,加速企业数字化转型与智能化升级的步伐。

凭借在多元算力、智能管理、高效算能、坚实安全底座等方面的优势,超云打造了涵盖智算、信创、云系统、云计算在内的全栈算力产品家族,通过融合AI技术,实现了算力、存储、云和融合管理的无缝衔接,在提升系统便捷性、稳定性和运维效率的同时,显著降低了管理和运维成本。

回顾近年,超云在AI算力基础设施领域持续创新,为行业带来了多项突破,其更加注重打造训练和推理服务器的竞争力。尤其是在推理层面,超云更是将其提升至公司战略层面,立下了“推理之巅、超云为先”的目标。目前,超云已完成了AI推理的全栈生态搭建,大模型、高密度、液冷、边缘等各类推理机器不仅符合国内的实际需求,而且在性能、成本和使用便利性等方面都达到了较高水平。

另一个技术狂想:具身智能的爆发点

机器人行业中一直存在一个经典悖论——物理世界中最难解决的“容易”问题。如蹲下、起身、跳跃、转圈等等,对机器人来说,这些简单的动作都需要极为复杂的机械控制系统来实现。而现实生活中常见的简单任务,如做饭、冲咖啡、搬货,把流程分解成每一个动作,并且要做到“不走形”。这一类“容易”问题层层累加,难度是指数级递增的。

与基于软件平台的“对话机器人”的逻辑推理、或者更高层次的“生成式涌现”不同,目前活跃在一线的商业机器人、工业机器人整体走的还是自动化控制路线,需要解决的更多是机械控制问题。要解决这些问题,算法是有边界的,大多数研发与工程瓶颈被卡在传感器、控制器这一类硬件单元上,软硬件的智能融合处于非常早期探索阶段。

大模型在自然语言连续对话、通识理解、少样本/零样本学习等能力方向的突破,补全了让机器人产业从1%到10%跃升的技术基础,这也是业内看中机器人+大模型的主要原因,使得机器人在软件层面终于看到了变革的曙光。

特斯拉带来的Optimus二代人形机器人,更灵活,可操作任务更复杂。第二代机器人在AI大模型的加持下,体重比一代更轻,步行速度加快,身体控制能力增强;手部关节全新升级,活动更加自然,手指部分搭载触觉传感器,甚至能完成抓鸡蛋等精细活。同时,Optimus二代还可以做多个深蹲动作,显示出其平衡能力有所增强。

傅利叶发布了首款全尺寸人形机器人GR-1,并率先实现量产交付。一年来,研发团队在仿真环境中训练GR-1,再将训练好的模型迁移到现实世界。通过远程遥操采集人类的动作数据,用于训练和改进仿真模型,GR-1得以模仿学习人类运动,完成跳舞、打鼓、放置物品等日常生活动作。GR-1还能在户外复杂地形如草地、非平整路面及泥泞斜坡上顺利行走,实现稳定、自主的运动控制表现,为机器人在实际应用中的高效作业打下坚实的基础。

每一次技术革新都推动着人类文明的脚步不断向前。在科技的璀璨星河里,我们跃入了崭新的人工智能时代,如同一个巨大的熔炉,汇聚着无数的机遇与挑战,冷思考与热驱动在这里碰撞出绚烂的火花。这个时代还有很多问题需要面对和解决,但翻越一座座大山之后,我们终将抵达辽阔的星辰大海。

【关于科技云报道】

专注于原创的企业级内容行家——科技云报道。成立于2015年,是前沿企业级IT领域Top10媒体。获工信部权威认可,可信云、数博会、国家网安周与全球云计算等大型活动的官方指定传播媒体之一。深入原创报道云计算、人工智能、大模型、网络安全、大数据、区块链等企业级科技领域。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1899238.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

芯科普| 矽光子是什麼?可以用在哪些领域?点击查看!

随着生成式人工智能的崛起,数据传输需求亦呈现爆发式增长。而在此背景下,台积电在半导体展览上披露的硅光子(SiPh:Silicon Photonics)技术进展,更是将硅光子推向了风口浪尖,成为了市场的宠儿。 …

一拖二快充线:生活充电新风尚,高效便捷解决双设备充电难题

一拖二快充线在生活应用领域的优势与双接充电的便携性问题 在现代快节奏的生活中,电子设备已成为我们不可或缺的日常伴侣。无论是智能手机、平板电脑还是笔记本电脑,它们在我们的工作、学习和娱乐中扮演着至关重要的角色。然而,随着设备数量…

【ue5】虚幻5同时开多个项目

正常开ue5项目我是直接在桌面点击快捷方式进入 只会打开一个项目 如果再想打开一个项目需要进入epic 再点击启动就可以再开一个项目了

如何网页在线编辑微软Office Word,并导出为PDF格式。

随着互联网技术的不断发展,越来越多的企业开始采用在线办公模式,微软Office Word 是最好用的文档编辑工具,然而doc、docx、xls、xlsx、ppt、pptx等格式的Office文档是无法直接在浏览器中直接打开的,如果可以实现Web在线预览编辑Of…

GPT-4o将改变论文学术文风,科学家揭示5年内百万篇论文“is”“are”词频减少10%!

在最近的一项研究中,意大利国际高等研究院(SISSA)的博士生耿明萌量化了 ChatGPT 对学术论文写作的影响。 与以往主要分析 ChatGPT 生成的段落或文章不同,这次研究更关注整体情况。 论文地址:https://arxiv.org/pdf/2…

YOLOv8改进 添加轻量级注意力机制ELAttention

一、ELA论文 论文地址:2403.01123 (arxiv.org) 二、Efficient Local Attention结构 ELA (Efficient Local Attention) 被用于处理自然语言处理任务中的序列数据。它旨在提高传统注意力机制的效率,并减少其计算和存储成本。 在传统的注意力机制中,计算每个输入位置与所有其…

NFT Insider #137:Polygon链上NFT销售额破7800万美元,TheSandbox通过创作者挑战推动社区参与

引言:NFT Insider由NFT收藏组织WHALE Members (https://twitter.com/WHALEMembers)、BeepCrypto (https://twitter.com/beep_crypto)联合出品,浓缩每周NFT新闻,为大家带来关于NFT最全面、最新鲜…

平安养老险宿州中心支公司积极参与“78奋力前行”集体健步行活动

7月3日,平安养老保险股份有限公司(以下简称“平安养老险”)宿州中心支公司组织员工参加由宿州市保险行业协会2024年“78奋力前行”线下集体健步行活动。 平安养老险宿州中心支公司员工高举公司旗帜,与同业伙伴一起出发&#xff0…

探索Figma:下载流程及使用前准备

Figma 是基于浏览器的 UI 设计合作工具。无需下载,打开浏览器使用。虽然更建议直接在浏览器中使用 Figma,但是如果确实需要下载 Figma 客户端,可以直接在 Figma 官网的 Products > Downloads 页面下载。如果你不能访问 Figma 官网&#xf…

软件测试面试题总结(超全的)

前面看到了一些面试题,总感觉会用得到,但是看一遍又记不住,所以我把面试题都整合在一起,都是来自各路大佬的分享,为了方便以后自己需要的时候刷一刷,不用再到处找题,今天把自己整理的这些面试题…

申请便宜SSL证书 Let‘s Encrypt泛域名SSL证书

在当今数字化时代,网络安全已成为公众和企业关注的焦点。 申请Lets Encrypt便宜泛域名SSL证书步骤 1. 登录来此加密网站,输入域名,可以勾选泛域名和包含根域。 2. 选择加密方式,一般选择默认就可以了,也可以自定义CS…

【代码随想录——图论——岛屿问题】

1.岛屿数量 https://kamacoder.com/problempage.php?pid1171 1.1 深度优先搜索 package mainimport "fmt"var direction [][]int{{0, 1}, {0, -1}, {1, 0}, {-1, 0}}func main() {var M, N intfmt.Scanln(&N, &M)sea : make([][]int, N)visited : make…

VUE3使用antd引入百度地图 实现位置查询,获取地址经纬度

实现效果&#xff1a; 1.index.html 中先引入下 <script type"text/javascript" src"http://api.map.baidu.com/api?v2.0&ak自己申请的key"></script> 申请密钥key地址&#xff1a;登录百度账号 注册登录后创建应用&#xff0c;根据自己…

Windows 下载安装ffmpeg

下载地址 https://ffmpeg.org/download.html 测试 管理员方式打开控制台&#xff0c;输入ffmpeg测试 配置环境变量

树形结构C语言的实现

一.什么是树&#xff1a; 树形结构是一层次的嵌套结构。一个树形结构的外层和内层有相似的结构&#xff0c;所以这种结构多可以递归的表示。经典数据结构中的各种树状图是一种典型的树形结构&#xff1a;一棵树可以简单的表示为根&#xff0c;左子树&#xff0c;右子树。左子树…

微服务框架Kratos学习笔记

环境配置 export GOPROXYhttps://goproxy.cn export GO111MODULEon go get -u github.com/go-kratos/kratos/tool/kratoskratos 工具安装完成 使用kratos命令创建新项目 kratos new kratos-demo看到这个提示&#xff0c;项目创建完成 go mod tidy 拉取项目依赖 生成所有pro…

3D生成模型TripoSR完美搭建流程,包含所有问题解决方案!

最近需要使用3D生成模型,无意中看到了TripoSR,觉得效果还行,于是打算在Linux系统上部署一下,结果遇到很多坑,在这里写一下详细的部署流程和部署过程中遇到的问题。 下面是TripoSR的源码地址。 GitHub - VAST-AI-Research/TripoSRContribute to VAST-AI-Research/TripoSR…

制造业产品展示革新:3D模型轻量化引领在线营销体验的全面升级

在当今数字化时代&#xff0c;在线展示已成为制造业企业吸引客户、促进销售的关键环节。随着消费者对产品细节、交互体验要求的日益提升&#xff0c;传统的图片与视频展示方式逐渐显露出局限性&#xff0c;难以满足市场对全方位、沉浸式体验的需求。 模型展示&#xff0c;尤其…

第五篇——谋攻篇:韩信该死,拿破仑该亡

目录 一、背景介绍二、思路&方案三、过程1.思维导图2.文章中经典的句子理解3.学习之后对于投资市场的理解4.通过这篇文章结合我知道的东西我能想到什么&#xff1f; 四、总结五、升华 一、背景介绍 人生也是如此&#xff0c;伤敌一千&#xff0c;自损八百&#xff1b;而不…

C++基础(六):类和对象(中-1)

上一篇博客&#xff0c;我们进入了面向对象的学习&#xff0c;知道了如何设计类&#xff0c;如何创建使用对象&#xff0c;这一篇博客我们再一次深入学习&#xff0c;这一节是类和对象的重点&#xff0c;其中的逻辑比较强&#xff0c;我们要深刻理解&#xff0c;消化&#xff0…