赛博·新闻
1、WAIC2024开幕:一半机器人,一半大模型
7月4日,AI界春晚——2024世界人工智能大会(WAIC 2024)在上海开幕,大会展示了500家企业的1500项展品,突出了机器人和大模型技术。国产机器人和大模型在AI应用,人机交互和专业领域展现出巨大潜力,预示着AI技术正快速融入日常生活和各行各业。总体来看,今年大模型的几个趋势是:
1、沿着Scaling Law,继续向上突破,解锁模型新的能力边界;
2、聚焦端侧,强调模型的效率和知识密度,做强而小的模型;
3、多模态能力融合,能说会动,继续挑战对物理世界的理解;
4、开始深入到千行百业,从强调能力到强调实用。
2、商汤科技发布「日日新5o」大模型,交互体验对标GPT-4o
在WAIC 2024大会上,国内AI初创公司商汤科技发布了全新模型「日日新5o」,号称为「国内首个所见即所得模型」,交互体验「对标」GPT-4o。据介绍,日日新5o通过整合跨模态信息,基于声音、文本、图像和视频等多种形式,带来一种全新的AI交互模式,即实时的流式多模态交互。除此之外,商汤还推出了首个面向C端用户的可控人物视频生成大模型Vimi。
3、百川智能AI健康顾问亮相,要媲美全科医生,模型能力行业领先
在WAIC 2024大会上,百川智能发布了AI医疗应用——AI健康顾问,百川的通用医疗增强大模型不仅在USMLE(美国医考)的评测中超越了GPT-4,并且在由医生(协和、北医等头部三甲高年资主任、主治医师)和心理学专家作为评测主体,对模型进行多角度评测的真实人工评测中,同样超越了GPT-4。
4、网易发布首个机器人品牌「灵动」
在WAIC 2024 大会上,发布首个机器人品牌「灵动」。据介绍,网易灵动是网易伏羲基于自研工业大模型和AOP技术思想打造的机器人品牌,旗下的挖掘机器人和装载机器人两款核心产品,已参与10多个省份的50个重点建设项目,覆盖矿山、港口、搅拌站、学校等多种应用场景。除此之外,网易有道还带来了全新的AI大模型学习硬件有道词典笔X7、预置国内首个教育大模型「子曰」的原生应用「AI全科家庭教师有道小P」和「虚拟人口语私教Hi Echo」。
5、阶跃星辰发布三款Step系列通用大模型新品
在WAIC 2024大会上,阶跃星辰宣布对Step系列通用大模型家族进行全面升级,连发三款Step系列通用大模型新品:Step-2万亿参数语言大模型正式版、Step-1.5V多模态大模型、Step-1X图像生成大模型。其中,最新发布的Step-2万亿参数语言大模型正式版,大幅提升了训练效率,据悉在数学、逻辑、编程、知识、创作、多轮对话等方面体感全面逼近GPT-4,企业和开发者可以通过阶跃星辰开放平台申请体验。
6、「可灵」Web端平台上线
在WAIC 2024大会上,快手在大模型论坛上宣布可灵AI网页端正式上线。其中,所有功能限时免费(需自行申请)。「文生视频」迎来画质升级,支持单次10s视频生成;「图生视频」画质升级,支持自定义首尾帧。「运镜控制」功能提供丰富的镜头控制选项,支持预设多种大师级镜头模式。
7、苹果或加入OpenAI董事会,有望和微软平起平坐
彭博社记者Mark Gurman报道,苹果App Store负责人、前营销主管菲尔·席勒(Phil Schiller)将在OpenAI董事会中担任观察员的角色,这也是上个月宣布的苹果和OpenAI合作协议的一部分。
8、AI音乐生成器Suno推出iOS应用程序
AI音乐生成器Suno推出了一个新的iOS应用,允许用户在iPhone上使用文本、自己的声音或者器乐来创作完整的歌曲。目前Suno的App只适用于美国的iPhone,但Suno表示它将在未来进入其他国家和地区并推出Android版本,并会带来一些「有趣的更新」。
9、Meta推出文生3D模型「重磅炸弹」,一秒生成逼真3D素材
Meta公司官方发布研究论文,介绍了一个名为Meta 3D Gen的文生3D模型系统,能够在不到一分钟的时间内从文本生成较高质量的3D资产。技术亮点如下:
- 高速生成:3D Gen可以在短短30秒内生成初步的3D资产,随后的纹理细化阶段仅需20秒,显著提高了3D资产的生成效率。
- 物理基础渲染(PBR)支持:3D Gen支持PBR,这对于重现3D资产在现实世界应用中的光照效果至关重要。
- 高保真度:通过专业3D艺术家的评估,3D Gen生成的3D模型在复杂文本提示下的忠实度和视觉质量上超越了现有的商业和非商业方法。
10、马斯克自曝Grok-2将于下月上线,Grok-3也在加紧训练
7月1日,马斯克在X平台透露,AI初创公司xAI的大模型Grok-2将于今年8月份推出。此外,尽管Grok-2尚未亮相,但马斯克还在X平台上为Grok-3造势。他表示,Grok-3用了10万块英伟达H100芯片进行训练,预计将于年底发布,在他看来,Grok-3「应该会很特别」。
11、阿里通义App上线「追星星的AI」
阿里巴巴通义App最近上线了「追星星的AI」,这是国内首个关爱孤独症儿童的AI绘本工具,免费为孤独症儿童家庭提供AI绘本服务。这款AI工具基于阿里自研Modelscope-Agent框架,调用了通义大模型的多项服务,可实现从一句话故事梗概到完整有声绘本的生成,支持生成常识认知、社交礼仪、心智解读、趣味故事等4种类型,还设置了3个不同的认知水平层级。
12、腾讯元宝上线「深度搜索」模式
7月1日,元宝迎来大升级:上线「深度搜索」模式,手机app更新到最新版本即可使用。所谓的「深度搜索」,其实就是让AI助手更聪明,延伸你的问题,回答得比基础搜索更广泛和深入,还能同步生成内容大纲、思维导图等格式。
13、金山办公发布WPS AI 2.0与首个政务自研模型
在WAIC 2024大会上,金山办公发布了WPS AI 2.0,包含WPS AI办公助手、WPS AI政务版等应用,并推出政务自研模型金山政务办公模型1.0。大会上演示了WPS AI升级后新增的4个AI办公助手:AI写作助手、AI阅读助手、AI数据助手、AI设计助手。而全新的金山政务办公模型1.0,基于13B的数据训练,擅长公文写作,可针对通知、请示、发言稿、通报、方案等5类公文进行撰写,相比通用类模型,金山办公自研模型可实现无口语化描述,按照公文风输出,输出的内容还自带公文格式。
赛博·洞见
1、WAIC首日集锦丨AI春晚,大佬都说了啥?
WAIC首日,对各位行业大佬的观点进行了总结:
- 周伯文(上海人工智能实验室主任、衔远科技创始人):AI安全方面的投入远远落后于AI性能的投入,目前世界上只有1%的资源投入在安全考量上。
- 姚期智(图灵奖得主、中国科学院院士、清华大学交叉信息研究院院长):AI风险的三个来源:网络风险、社会风险、生存风险,并强调了控制AI的重要性。
- 李彦宏(百度创始人、董事长兼首席执行官):避免掉入“超级应用陷阱”,AI时代的应用应更注重实际增益而非用户日活跃度(DAU);智能体是AI应用的重要方向,搜索是智能体分发的最大入口;开源模型在特定场景有价值,但商业化的闭源模型更适合大多数应用场景。
- 傅盛(猎豹移动董事长兼CEO,猎户星空董事长):智能涌现是一个灰盒状态,可能有多条路线,鼓励创业者投入AI技术以实现产业变革。
- 安德雷斯·韦思岸(Andreas Weigend,社交数据实验室创始人、亚马逊前首席科学家):人与AI的区别在于好奇心和审美。
- 王坚(中国工程院院士、之江实验室主任、阿里云创始人):GPT的潜力尚未被完整探索,AI的发展与过去不同,机会属于所有企业。
- 张平安(华为常务董事、华为云CEO):AI创新需要云端释放算力需求的创新。
- 井贤栋(蚂蚁集团董事长兼CEO):大模型落地面临的三大难题,通过专业智能体的深度连接,AI能带来服务的代际升级。
- 徐立(商汤科技董事长兼CEO):应用是AI“超级时刻”的关键,走向广泛应用的三大突破点:高质量数据、流畅的交互、可控性。
- 孟樸(高通公司中国区董事长):终端与云端的紧密结合对生成式AI规模化扩展和加速数字化转型的重要性。
- 闫俊杰(MiniMax创始人兼CEO):降低大模型的错误率是AI应用的关键。
- 张鹏(智谱AI首席执行官):大模型的多模态能力是核心突破,大模型降价不能长久。
2、黄仁勋最新专访:如果不全力以赴,英伟达可能会在30天内破产
7月2日,英伟达黄仁勋与美国生物科技公司Recursion联创&CEO Chris Gibson进行了一场炉边对话。在访谈中,黄仁勋认为,每家公司本质上都处在危险状态,如果不能保持全力以赴,英伟达也可能会在30天内破产。英伟达投资有三大指导原则:问题是否具有挑战性?英伟达能否提供独特的贡献?是否会产生深远影响?黄仁勋称英伟达的愿景是助力未来的每一辆车实现自动驾驶,以确保它们达到尽可能高的安全标准。他预见,生成式AI将颠覆软件编写和处理领域,帮助开发新的软件类型并解决新的问题。
3、a16z创始人Marc Andreessen的创业指南,关于商业和创业最好的文章之一
这篇文章是Marc Andreessen为创业者提供的指南,涵盖了创业过程中的多个关键方面,包括创业的挑战、风险投资的策略、产品市场契合(PMF)的重要性以及高管团队的构建和管理。其中,PMF的概念被第一次提出,包括本文在内的系列文章被认为是「关于商业和创业的一些最好的文章」,由极客公园编译。
4、AI时代正确的学习姿势
MQ老师在文章中探讨了AI时代教育的困境和机遇,提出利用AI技术提升教育质量和学习效率,培养人机协作和元认知能力。文章还讨论了文科生在AI时代的优势,并提供了一些AI辅助学习的方法和智能体,共同培养AI时代的原住民。
5、OpenAI首位投资人Vinod Khosla伯克利分享:只有企业家能够改变世界,哪怕90%失败率
本文是关于OpenAI首位投资人Vinod Khosla在伯克利的分享,他强调企业家精神和创新的重要性,以及在高失败率下如何通过团队、愿景和学习实现改变世界的目标。他提出,成功的关键在于团队而非计划,前十名员工对初创公司的未来至关重要。他提倡在招聘时重视候选人的激情、愿景和学习能力。Khosla还强调了期权池的重要性,建议为早期员工预留大量股份以吸引和激励顶尖人才。他指出,重大创新往往来自行业外部,以特斯拉和亚马逊为例。对于缺乏技术专长的创始人,他建议招募技术合伙人。
6、苹果智能和AI极简主义
苹果公司在人工智能领域倡导了一种与AI极大主义相对立的策略,认为生成式AI应该作为基础设施而非平台或产品,强调将 AI 集成到设备中,以提供新的功能和能力。
- 苹果认为生成式 AI 应该作为基础设施,而非独立的产品或平台。
- 苹果的 AI 策略强调将 AI 集成到设备中,利用设备上的用户上下文来提供个性化的功能。
- 苹果区分了上下文模型和世界模型,后者可能会成为可互换的插件。
- 苹果的策略可能会减少对云计算的依赖,推动 AI 技术的商品化。
- OpenAI 在与苹果合作中的地位并不稳固,苹果可能会将更多功能转移到自己的模型上。
- AI 技术的未来可能不会有一个单一的赢家,而是会有多个参与者共存。
- 苹果的 AI 芯片和软件栈的发展可能会推动更多的 AI 计算从云端转移到边缘设备。
7、大厂高管转战 AI 创业盘点:超 25 人,覆盖全产业链,AI 应用最热门
文章概述了超过25位互联网大厂高管投身生成式AI创业的动态,他们来自阿里、腾讯、百度、字节、京东、美团、网易、快手等多家互联网大厂,涉及AI应用、数据服务、咨询及技术服务等多个领域。
8、iA:扭转人工智能局面
现在每家公司的产品都在利用 AI 直接给出答案,让用户跳过思考的过程。著名的写作工具 iA 想反过来用 AI 帮助你进行思考。
- 不要问AI,让AI问你:让 ChatGPT 提示我们,向你询问有关你所写内容的问题,督促自己清楚地表达自己真正想说的话。比如:我想写关于[主题]的[格式]。一次问一个问题,迫使我解释我的想法。
- 不要抄袭,自己创造:如果ChatGPT生成了我想保留的有用内容怎么办?可以将它作为注释粘贴,并标记为AI生成,使用引号和标记,并注明其来源。
- 不要模仿,要创造:如果人工智能正好说出了我想说的话怎么办?重新思考并用自己的话来表达。先问问生成的内容是否真的正确。
9、OpenAI COO 最新 CNBC 采访:十年后,今天出生的孩子很难想象无法与计算机对话的世界,我们仍然处于非常早期阶段
7 月 6 日,OpenAI COO Brad Lightcap 在 Global Conference 2024 峰会上接受了 CNBC 高级记者 Julia Boorstin 采访,Lightcap 就 AI 未来发展以及行业趋势进行了分析。他强调,OpenAI 正在通过与各行各业的企业建立合作伙伴关系,帮助他们利用 AI 技术提升效率和创新能力。
10、对话腾讯汤道生:AI不止于大模型
本文是张小珺对腾讯云与智慧产业事业群CEO汤道生的访谈,深入探讨了腾讯在人工智能领域的战略布局、对大模型的看法以及汤道生个人对AI技术革命的理解和思考。汤道生强调,AI技术不应仅限于大模型,而应有更全面的视角。他分享了腾讯在AI领域的四层布局:基础设施、工具层、模型层和应用层,以及腾讯如何通过内部机制保持创新和对新技术的敏感度。汤道生还讨论了AI技术在to C和to B领域的应用,以及腾讯如何应对新一轮技术变革。
11、奥特曼终极野心:要成为“世界之王”掌控未来|OpenAI崛起大揭秘
外媒近期上线《智启:OpenAI的崛起》(Foundering: The OpenAI Story)系列音频节目,详尽地探索了奥特曼的崛起之路,以及他如何在这场构建领先人工智能技术的激烈竞赛中脱颖而出。同时,节目也触及了人工智能技术可能给人类生存带来的威胁,以及一场几乎颠覆一切的“宫斗”,这场“宫斗”曾让奥特曼陷入绝境,但他最终再次站了起来。本期为第五集,大家可以查看前几期:
- 第一集|弄权高手奥特曼靠人脉积累巨大影响力
- 第二集|马斯克退出内幕曝光,奥特曼趁机上位
- 第三集|AI究竟是天堂还是地狱
- 第四集 | 奥特曼要用AI均贫富,亲妹妹却无家可归
赛博·工具
1、流光卡片
一款免费好用的制作文字卡片工具。
2、imageSearch:最好用的以图搜图聚合站
一个以图搜图的网站,聚合了百度和谷歌的结果。
3、VoiceChanger.im
免费在线的AI语音克隆器和文本转语音工具。
4、Mojo:制作 Logo 动画
使用AI制作logo动画,效果还不错。
5、WOJAK MEME GENERATOR:meme图片生成器
一个很火的小工具,由 Glif 开发的完全自动化的 Wojak meme生成器,效果很好。
赛博·资源
1、DictionaryByGPT4
一本GPT4生成的单词书,超过8000个单词分析,涵盖了词义、例句、词根词缀、变形、文化背景、记忆技巧和小故事。
2、数字玩家:一款免费共享的GPT账号的工具
一款免费使用ChatGPT Plus会员账号的工具,体验与官网一致,对话隔离。
3、Retool 发布 2024 上半年《人工智能现状报告》
Retool 走访并收集大约 750 名业内人士的看法,包括开发人员、数据团队、领导层等,发布了 2024 上半年《人工智能现状报告》。在最新的报告中,大多数受访者对 AI 持谨慎态度,认为其略微被高估。Retool 指出,激进的炒作暂时掩盖了 AI 的真正潜力,这具体表现为:
- AI 被硬塞进产品中,却没有真正增加价值
- AI 被用作机器学习、LLMs 和自动化的总称
- AI 被视作无所不能,而忽略了繁琐的提示词和幻觉
4、大模型 API 文档一览:有的简洁易用,有的乱七八糟
作者按照模型首字母排序,逐一评价了Baichuan、DeepSeek、GLM、MiniMax、Moonshot、Qwen、Spark、Stepfun和ERNIE等九个模型的API文档,包括它们的清晰度、易用性、价格信息和对OpenAI SDK的支持情况。
5、【甲子光年】自动驾驶行业报告(关注公众号【产品老A】回复【自动驾驶行业报告】下载)
甲子光年出品,本报告深入分析了自动驾驶行业的发展趋势、技术路线选择、厂商实践案例,并探讨了端到端自动驾驶技术面临的挑战与未来发展前景。报告首先指出智能化已成为汽车消费者的核心购买因素之一,接着分析了自动驾驶技术的发展背景和趋势,包括NOA技术的快速渗透和自动驾驶科技公司的IPO热潮。报告详细讨论了厂商在技术路线选择上的实践,以及端到端自动驾驶的挑战和未来式,包括对算力、数据和可解释性的需求,以及消费者对自动驾驶功能付费意愿的调查分析。
6、【德勤】AI案例精选(关注公众号【产品老A】回复【AI案例精选】下载)
德勤人工智能研究院发布,本文档详细介绍了AI技术在消费行业、能源资源和工业、金融服务业、政府和公共服务、生命科学与健康管理、技术媒体和电信等多个行业的应用案例。每个行业部分都探讨了AI技术如何解决关键业务问题、提供帮助以及潜在的益处。文档强调了AI技术在提高效率、降低成本、增强客户体验、优化运营等方面的巨大潜力,并讨论了AI技术面临的挑战和应对策略。
【推荐时间】
给大家推荐一个性价比超高的GPU算力平台:UCloud云计算旗下的Compshare算力共享平台,目前注册送20元测试金,可以畅享7小时4090算力,预装了主流的大模型和环境的镜像,开箱即用,非常方便。