最近这几天,相信已经有很多朋友看到了关于GPT Store、Vision Pro、Rabbit R1、AI pin、英伟达ACE(Avatar Cloud Engine)、钉钉个人助理、荣耀MagicOS 8.0等各类和AI技术深度结合的AI Agent或者承载AI Agent的平台。有些是和个人应用相关,比如钉钉个人助理和荣耀MagicOS 8.0就是针对个人的应用;有些和企业机构相关,比如英伟达ACE(Avatar Cloud Engine)可以被游戏公司使用,用来提高的游戏体验。
而苹果公司的Vision Pro则可以被个人或公司用来作为更进一步的商业应用;GPT Store是OpenAI开发的一个类似Apple Store的平台商店,可以为个人或者企业开发者提供一个集成的应用商店,它本身并不是一个AI Agent,但它是一个允许用户创建和定制AI Agent的平台。
在当前的科技环境下,人工智能代理(AI Agent)的应用领域正在迅速扩展,涵盖了我们日常生活和工作的各个方面。这一趋势的背后,是各大公司在产品开发和业务竞争中的不断创新和努力。
为什么在2024年开年之初便会有如此多的AI Agent密集的发布呢?就像在2023年初,各类大模型密集的发布一样,回想2033年大模型的密集爆发也是得益于大数据、大算力的支持下得到快速的发展,2024年初AI Agent的爆发同样源于软硬件技术条件的成熟、大规模的市场需求、丰富多样的数据资源。
如果说2023年的大模型密集爆发是AI的上半场比赛,那么2024年AI Agent的密集发布则属于AI的下半场比赛。不同于上半场,大家都在忙于基础模型和应用模型的竞争,下半场比的是真正的市场端,如果说上半场的用户是B端客户,那么下半场的用户则逐渐转移到C端,C端面对的是全球50亿的社交媒体用户,优质的AI Agent将不亚于当年苹果手机对手机行业的革命。
C端市场也是真正的造富矿场,纵观全球高市值公司无一例外都是C端市场,而C端市场的用户也最挑剔,因为C端面向的是不同的个体,想要将不同个体的需求爱好统一,确实很难,但是正因为如此,优质的产品研发公司才会真正致力于为人类发展而奋斗,开发出每个人都喜欢的产品,2024年注定是AI Agent激烈竞争的开始。
一、个人助理时代的开始:MagicOS 8.0
2023年1月10日,荣耀在其开发者大会上发布了业界首款基于AI意图识别的人机交互(IUI)操作系统——MagicOS 8.0(魔法OS 8.0)。这个全新的操作系统集成了荣耀自主研发的平台级7B端侧AI大模型——Magic大模型,它不仅强化了操作系统的内核,还为IUI提供了全面的AI能力支持。
平台级AI与应用级AI的主要区别在于,前者可以作为技术基础,全面赋能操作系统,被视为下一代操作系统的「新内核」。传统的操作系统内核主要负责管理和调度系统的硬件资源,如GPU、内存等,以确保系统的正常运行和高效利用。然而,随着用户需求的日益增长,AI系统需要解析许多与人相关的因素,以实现真正以人为中心的体验。
对于个人知识库、人的位置和状态感知、人的习惯和画像学习这三类与人相关的因素,传统的操作系统无法进行有效的计算和处理。因此,我们需要一个全新的内核来满足这些需求。平台级AI的强大之处在于,它能够管理和处理多种个人因素,帮助操作系统精准识别用户的意图。
有了这样的能力,全新的操作系统就能为所有人带来“猜你所想,懂你所需”的智慧体验,这无疑是人机交互的一大进步。这也预示着我们正在迈向一个新的时代,一个人工智能与人类生活深度融合的时代。
还记的2007年苹果手机发布会上,乔布斯曾展示了苹果革命性的用户界面历史,从电脑鼠标,到iPod点击轮,再到初代iPhone多点触摸屏,对手机行业进行了革命,如果说以苹果手机为代表的多点触屏技术是对手机的第一次人机交互的革新,那么以荣耀MagicOS 8.0为例AI大模型技术则是对手机的第二次人机交互的定义。
以AI大模型全新定义的MagicOS 8.0就是一个全面的个人助理,它可以贴心为你规划一天的行程,为你的生活和工作进行高效的安排,无论是出行打车、还是酒店住宿,亦或是个人工作安排计划,总之,它包括了衣食住行的各个方面。关于创作方面就更方便了,只需张一张嘴,无论是设计图还是演讲稿,都信手拈来,不满意了还可以让它帮你随时更改。
从产品研发更新的规律来看,荣耀MagicOS 8.0只是开始,相信未来会有更多革命性技术应用融入到个人电子产品当中的。
荣耀MagicOS 8.0无疑给我们带来了对未来科技的憧憬,或许在不久的某一天,每个人都会有一个类似《钢铁侠》电影中贾维斯那样的智能管家,而这个智能管家可以集成在手机上,也可以集成在手表、耳机、项链、戒指等任何穿戴设备之上。
二、虚拟世界的完美向导:Apple Vision Pro
如果说荣耀MagicOS 8.0的发布,为我们提供了一种全新的个人助理体验,就像一个贴心的管家。那么苹果公司推出的Vision Pro,则为我们打开了一扇通往虚拟世界的大门,带来了前所未有的导航体验。据苹果公司最新发布的消息,Vision Pro将于2月2日在美国上市,1月19日即可开启预订。这款研发了七年之久的巅峰之作,将带领人们开启空间计算时代。
那么,Vision Pro究竟是什么?它能做些什么呢?根据苹果公司的首席执行官Tim Cook的说法,Vision Pro的出现,使我们不再受到显示器的束缚。Mac为我们引入了个人计算的概念,iPhone则让我们体验到了移动计算的便捷,而Apple Vision Pro则将我们带入了空间计算的新时代。
Apple Vision Pro是苹果公司几十年来在高性能、移动和可穿戴设备设计方面的经验的结晶。它不仅继承了苹果的优良传统,更在技术和设计上进行了创新和突破,为我们提供了一种全新的计算体验。无论是在工作中,还是在生活中,Apple Vision Pro都能为我们提供强大的支持和帮助。
Vision Pro作为一款智能穿戴设备,与市面上的其他同类产品有着显著的区别。当你戴上 Vision Pro,你并不会感到与世界隔绝,反而会有更深入的交互体验。Vision Pro 头戴设备的独特之处在于其配备了一个面向外部的显示屏。
这个显示屏可以通过 EyeSight 系统,捕捉并显示用户的眼球运动和面部表情。这意味着,当用户通过 Vision Pro 浏览内容时,显示屏上会出现光环闪烁,向周围的人传达出用户正在沉浸在增强现实(AR)世界中的信息。
更为人性化的是,当有任何人或物体进入用户的视线范围内时,Vision Pro 会自动将其聚焦,使用户能够及时注意到周围环境的变化。这种设计,既保证了用户在虚拟世界中的沉浸体验,又兼顾了用户在现实世界中的安全。
为了完美配合 Vision Pro,苹果公司还发布了全新的操作系统——VisionOS。这是苹果公司首次推出的空间操作系统,它的出现标志着苹果公司在操作系统领域的又一次创新。VisionOS不仅继承了macOS、iOS和iPadOS的优秀特性,更在此基础上,为用户提供了强大的空间体验。这一切都得益于VisionOS全新的三维界面设计,它使用户能够在物理世界中直观地看到并感受到数字内容。
更为出色的是,VisionOS能够动态响应自然光线,并投射出阴影,这一设计使用户能够更好地理解物体的比例和距离。无论是在工作中,还是在生活中,VisionOS都能为用户提供前所未有的空间体验。VisionOS是苹果公司对未来计算体验的深思熟虑和精心设计的产物,它将与Vision Pro一起,引领我们进入一个全新的数字世界。
Apple Vision Pro为了实现用户的导航需求和与空间内容的交互,引入了一种全新的输入系统,这种设计,使得用户的操作更加直观和便捷。这个系统由眼睛、手势和声音控制,使用户可以通过简单的注视、轻轻的手指敲击或者语音指令来浏览应用程序,让你的世界可以无限扩展,没有物理世界的限制。任何想去的地方,立刻就能呈现在你的眼前。
Vision Pro的应用场景非常广泛,不仅可以在娱乐和办公中发挥作用,还可以与苹果的其他产品相结合,提供更加沉浸式的体验。例如,用户可以通过Vision Pro以更加沉浸的方式浏览照片和视频库,这种体验是其他设备无法比拟的。特别是在浏览全景照片时,Vision Pro带来的体验革命性的改变。它可以将用户带回到拍摄照片时的具体场景,让用户仿佛亲身在场。这是之前苹果的其他设备无法做到的,也是Vision Pro的一大创新之处。
三、Apple Store的再现:GPT Store开启分钱时代
说起Apple Store,苹果手机用户并不陌生,因为无论是购买新产品,还是寻求产品支持,都需要在Apple Store上操作。因此, Apple Store是一个提供苹果产品和服务的平台。那么GPT Store又是什么?
从GPT Store界面的构成来看,像极了苹果的应用商店,类目包括:
-
lFeatured:本周精选特色应用;
-
lTrending:社区最受欢迎的GPTs;
-
lBy ChatGPT:由ChatGPT团队创建的GPTs。
1 月 10 日,OpenAI 的应用商店 GPT Store 正式上线,分类、趋势、每周精选等栏目一应俱全,根据应用的用途,GPTs还被划分为“写作”、“效率”、“研究和分析”、“编程”、“教育”和“生活方式”等类目。
OpenAI Greg Brockman 表示,这是打造自己的 ChatGPT 的第一步。该产品仍在试验阶段,但希望在未来几周内更广泛地推广。OpenAI 还将在每周重点介绍有用和有影响力的特色 GPT。
OpenAI 还宣布了一项新的计划,即将于今年第一季度与 GPT 的创建者共享收入。这个计划的核心是,GPT 的创建者将根据用户与聊天机器人的互动程度来获得相应的报酬。即每个GPT应用的创建者都可以成为OpenAI GPT Store的合伙人,可以在GPT Store上创建有趣的应用,只要用户和这些应用进行交互,创建者就有机会分到相应的费用。
然而,OpenAI 尚未公开这个计划的具体细节。例如,目前还不清楚他们将如何计算付款,也不知道他们将如何衡量用户的参与度。如果一个用户只是试用了几秒钟,然后因为不喜欢而关闭了聊天机器人,那么这种情况是否会计入 GPT 的参与度?这是衡量用户参与度的唯一方式吗?
这些都是GPT创建者关注的问题,大家都很期待 OpenAI 能尽快公开更多的信息,以便创建者们更好地理解这个计划。这个计划无疑是对 GPT 创建者的一种鼓励,也是对他们贡献的一种认可。大家都期待看到这个计划的实施,以及它将如何影响 GPT 和聊天机器人的发展。
GPT Store 正在为 ChatGPT Plus 用户、企业用户以及新推出的团队用户(ChatGPT Team)提供服务。可见,OpenAI不但吸纳了众多的个人用户,还瞄准了企业用户,相信用不了多久,就会出现众多在GPT Store上创业的个人和企业。
ChatGPT Team 是 ChatGPT 的付费版本,专为约 150 人的小型团队设计。与 ChatGPT 企业版相似,ChatGPT Team 用户也能够使用 GPT-4、DALL-E 3 以及 OpenAI 的高级数据分析功能,并对数据进行控制。OpenAI 已明确表示,ChatGPT Team 的数据和对话不会被用于训练其任何模型。
此外,ChatGPT Team 的用户还可以根据团队的特定需求创建自定义的 GPTs,或者选择使用商店中的其他 GPTs。这为团队提供了极大的灵活性和便利性。
至于 ChatGPT Team 的收费标准,按年计费的方式是每位用户每月 25 美元;如果选择按月计费,那么每位用户每月需要支付 30 美元。这种灵活的计费方式旨在满足不同团队的需求,使他们能够根据自己的预算和需求选择最合适的计费方式。ChatGPT Team 是一个强大而灵活的工具,旨在帮助团队更好地利用 GPT 技术,提高工作效率和创新能力。
四、AI Agent的应用启示
从大模型到AI Agent的发展,人工智能的发展时间表已经到了具身人工智能出现的前夜,它对人类的生活方式将会造成巨大的影响。
1、单智能体应用:单智能体应用是AI Agent的一个重要应用领域,具体来说,AI Agent可以作为个人助理,帮助用户处理日常任务和重复劳动。他们能够独立分析、计划和解决问题,减轻个人的工作压力,提高任务解决效率。
AI Agent可以帮助用户管理日常任务,例如设置提醒,安排日程,发送电子邮件等。他们可以根据用户的需求和习惯,自动调整任务的优先级和时间安排。它可以帮助用户检索和分析信息。可以从大量的数据中找出相关的信息,帮助用户做出决策。帮助用户自动化一些重复的任务,例如数据录入,文件管理等。这样可以节省用户的时间,让用户有更多的时间去处理更重要的事情。
AI Agent可以帮助用户解决问题。他们可以分析问题,提出解决方案,甚至直接执行解决方案。AI Agent还可以通过学习用户的行为和偏好,逐渐适应用户的需求,提供更个性化的服务。由于AI Agent是基于云的服务,所以他们可以在任何时间、任何地点为用户提供服务。
2、多智能体系统:多智能体系统是一种由多个AI Agent组成的系统,这些Agent可以以协作或竞争的方式相互交互。这种交互方式使他们能够通过团队合作或对抗性互动来实现进步。
在协作模式下,多个AI Agent可以形成一个团队,共享信息和资源,共同解决问题。例如,他们可以协作完成复杂的任务,如搜索救援、物流配送或者在线游戏等。在这种模式下,AI Agent需要具备良好的沟通和协调能力,以便在团队中发挥最大的效果。
在竞争模式下,AI Agent之间会进行竞争,以达到各自的目标。例如,在一些策略游戏中,AI Agent需要通过对抗性互动来击败对手。在这种模式下,AI Agent需要具备强大的策略和决策能力,以便在竞争中取得优势。
无论是协作还是竞争,AI Agent都可以通过这些互动来学习和进步。他们可以从每一次的交互中获取新的知识,改进他们的策略,以便在未来的任务中表现得更好。这种能力使AI Agent在许多领域,如机器学习、游戏理论和机器人技术等,都有着广泛的应用前景。
多智能体系统是AI领域的一个重要研究方向,它通过模拟和研究多个AI Agent的交互行为,为我们理解和设计更复杂、更智能的AI系统提供了可能。这种系统不仅可以帮助我们解决更复杂的问题,还可以为我们提供更深入的洞见,帮助我们理解如何设计和管理由多个智能体组成的系统。这对于推动AI技术的发展和应用具有重要的意义。
3、人机合作:人机合作是AI Agent的一种重要应用方式,它可以使AI Agent与人类用户进行互动,以提供帮助并更高效、安全地执行任务。
AI Agent可以通过各种方式与人类用户互动。例如,他们可以通过语音、文字或图像等方式接收和理解用户的指令。他们还可以通过这些方式向用户提供反馈,以帮助用户了解AI Agent的状态和行为。
AI Agent可以为人类用户提供各种类型的帮助。例如,他们可以帮助用户搜索信息、解决问题、学习新的技能,甚至在复杂的环境中进行导航。他们还可以在需要的时候提供安全的保障,例如在自动驾驶汽车中控制车辆的行驶,以保证乘客的安全。
AI Agent可以理解人类的意图,并据此调整他们的行为。他们可以通过学习用户的行为模式和偏好,以更好地满足用户的需求。例如,一个AI Agent可能会学习到用户喜欢在早晨听新闻,于是在每天早晨自动播放新闻。
人机合作使AI Agent能够更好地服务于人类,提高我们的生活质量和工作效率。同时,它也为AI Agent提供了一个学习和进步的机会,使他们能够不断提升自己的能力和性能。这种合作关系是建立在互相理解和信任的基础上的,需要AI Agent具有高度的适应性和灵活性。只有这样,AI Agent才能真正成为我们生活和工作中的得力助手。
4、专业领域:AI Agent可以针对特定领域进行训练和专门化,例如软件开发、科学研究或其他行业特定任务。他们可以利用大规模语料库的预训练以及泛化到新任务的能力,在这些领域提供专业知识和支持。
在软件开发方面,AI Agent可以被训练来理解和生成代码,帮助开发人员更高效地编写和调试程序。他们可以提供代码建议,自动完成代码片段,甚至帮助检测和修复代码中的错误。此外,AI Agent还可以帮助开发人员理解复杂的代码库,通过提供代码的结构和功能概述,使他们能够更快地熟悉新的代码环境。
在科学研究领域,AI Agent可以被训练来理解和生成科学文献,帮助研究人员跟踪最新的研究进展。他们可以自动从大量的科学文献中提取关键信息,如实验结果、研究方法和结论。此外,AI Agent还可以帮助研究人员设计和执行实验,通过提供实验设计的建议和预测实验结果,使他们能够更有效地进行科学研究。
AI Agent可以被训练来执行各种行业特定的任务。例如,在医疗行业,AI Agent可以帮助医生诊断疾病,提供治疗建议,甚至预测疾病的发展趋势。在金融行业,AI Agent可以帮助分析市场趋势,预测股票价格,甚至帮助制定投资策略。
这些AI Agent的训练和专门化是基于大规模语料库的预训练以及泛化到新任务的能力。他们可以从大量的数据中学习,然后将这些知识应用到新的任务中。这种能力使他们能够在各种专业领域中提供专业知识和支持,帮助人类更高效、准确地完成任务。AI Agent的专业领域应用是人工智能发展的一个重要方向,它将极大地推动各行各业的进步。
从大模型的百模大战到AI Agent的千帆竞发,过去的一年和未来的一年注定是AI发展历程中浓墨重彩的的一笔。