Agent不仅将改变人们与计算机的互动方式,还将颠覆软件行业,引发自从我们从键入命令到点击图标以来计算机领域的最大革命。
保罗·艾伦和我一起创立微软的至今,我对软件的热爱至今依然不减。
然而,尽管在过去的几十年中软件已经取得了很大进步,但在很多方面,软件还是显得相当“笨拙”。
在电脑上执行任何任务,你都需要指定要使用的应用程序。虽然你可以使用微软Word或谷歌文档来撰写商业提案,但这些工具无法帮助你发送电子邮件、分享自拍、分析 数据、安排聚会或购买电影票。 即便是最优秀的网站,也仅能片面理解你的工作、个人生活、兴趣和人际关系,并且在利用这些信息为你服务方面能力有限。 目前,这种工作通常只能由人类完成,例如你的密友或个人助理。
但在未来五年,这一切将彻底改变。你不再需要为不同的任务切换不同的应用程序。你只需用平常的语言告诉你的设备你想做什么。软件将能够根据你愿意分享的信息量,因为它对你的生活有了深入的了解,所以能够做出个性化的响应。
在不久的将来,任何一个上网的人都能够拥有一个由先进人工智能驱动的个人助理。
这类软件,能够理解自然语言并根据对用户的了解完成多种任务,被称为“Agent”。我对Agent的思考已近30年,在 1995年出版的《 未来之路》一书中我曾提到过它们,但直到最近,因为人工智能的进步,它们才真正变得实用。
Agent不仅将改变人们与计算机的互动方式,还将颠覆软件行业,引发自从我们从键入命令到点击图标以来计算机领域的最大革命。
1
每个人的个人助理
有批评家指出,软件公司以前也提供过类似的服务,但用户并没有完全接受。(人们至今仍然会拿Clippy这个我们曾经在微软Office中加入后来又放弃的数字助理开玩笑。)那么,为什么人们会使用Agent呢?
答案是,Agent将大幅改进。你将能够与它们进行更为细腻的对话。它们将变得更加个性化,并不仅仅局限于诸如写信等相对简单的任务。Clippy与Agent之间的差异,就像旋转电话与智能手机之间的差异一样大。
Agent将能够在你愿意的情况下协助你完成所有活动。一旦获得权限,Agent可以跟踪你的在线互动和实际位置,从而深入了解你所参与的人、地点和活动。它将掌握你的个人和工作关系、兴趣爱好、偏好和日程。你可以选择何时何地让它介入协助你做决定或帮助完成某项任务。
要了解Agent将带来的巨大变化,我们可以将它们与今天的AI工具进行对比。这些工具大多是机器人,限制在单个应用程序中,通常只在你特定提出需求时才会介入。由于它们无法记住你每次的使用习
惯,因此无法学习并适应你的偏好。
“Clippy就是一个机器人,而不是Agent。”
Agent则更加智能。它们能够主动提出建议,而不仅仅是在你提出请求时才反应。它们能够跨应用完成任务,并且随着时间的推移不断进步,因为它们能记住你的活动并识别你行为中的意图和模式。基于这些信息,它们会主动提供它们认为你需要的东西,尽管最终决定权始终掌握在你手中。
想象一下,你想规划一次旅行。一个旅行机器人可能只能帮你找到符合预算的酒店。而Agent则知道你将在哪个季节出行,并且根据它对你是否总是尝试新目的地或喜欢重复访问同一地点的了解,能够为你提出目的地建议。在被询问时,它还会根据你的兴趣和冒险倾向推荐活动,并为你预订你喜爱的餐厅。如果你今天想要这种深度个性化的规划,你需要支付旅行Agent的费用并花时间告诉他们你的需求。
AIAgent最令人兴奋的影响,在于它们将让今天对大多数人来说过于昂贵的服务变得普及。它们将在医疗、教育、生产力以及娱乐和购物等四个领域产生巨大的影响。
2
医疗保健
在当今医疗保健领域,人工智能主要是协助处理行政类任务。例如,Abridge、Nuance DAX和Nabla Copilot等系统可以在医生诊断时记录音频,并整理成笔记供医生审核。
真正的变革将在Agent能够协助患者进行初步分诊、提供处理健康问题的建议,以及判断是否需要就医时到来。这些Agent还将助力医疗工作者做出更明智的决策,提升其工作效率。(例如,像Glass Health这样的应用能够分析患者病情摘要,并为医生提出可能的诊断建议。)对病人和医疗工作者的帮助,对于那些贫穷国家的人们尤为重要,因为在那里很多人根本无法看到医生。
这些临床Agent的推广速度会慢于其他类型,因为准确无误是关乎生死的大事。人们需要确信,尽管这些健康Agent不完美且可能犯错,但总体上是有益的。当然,人类也会犯错,没有医疗保健同样是个问题。
“美国有一半需要心理健康护理的退伍军人没有得到相应的治疗。”
心理健康护理是另一个Agent将普及至几乎所有人的服务领域。如今,每周进行一次心理治疗似乎是一种奢侈。但实际上,有很多未被满足的需求,很多需要心理治疗的人却无法获得。例如,兰德公司的研究发现,美国有一半需要心理健康护理的退伍军人并未得到治疗。
经过专业心理健康训练的AIAgent将使心理治疗变得更加经济实惠且易于获取。Wysa和Youper是这一领域的两个早期聊天机器人示例。但Agent的作用将更加深入。如果你愿意与心理健康Agent分享充分的信息,它将能够理解你的生活历史和人际关系。它会在你需要时随时待命,永远不会感到不耐烦。有了你的允许,它甚至可以通过智能手表监测你在治疗过程中的生理反应——比如当你谈论与老板的问题时心跳加速——并建议你何时应该寻求人类心理治疗师的帮助。
3
教育
几十年来,我一直对软件如何简化教师工作和帮助学生学习充满期待。它不会取代教师,而是会补充他们的工作——为学生量身定制教学内容,并让教师从繁琐的文书工作和其他任务中解放出来,从而有更多时间专注于工作的最重要部分。这些改变终于以显著的方式开始实现。
目前的先进技术是可汗学院开发的基于文本的机器人Khanmigo。它能够在数学、科学和人文学科中为学生提供辅导——例如,解释二次方程式并创建数学习题供练
习。它还能帮助教师进行课程规划等工作。我长期以来一直是Sal Khan的工作的支持者,并最近在我的播客中邀请他讨论教育和AI。
但基于文本的机器人只是第一步——Agent将开启更多的学习机会。
例如,很少有家庭能负担得起为学生提供一对一辅导来补充课堂学习。如果Agent能够模仿有效家教的特点,它们将为所有需要的人提供这种补充教学。如果一个辅导Agent知道一个孩子喜欢Minecraft和泰勒·斯威夫特,它将利用Minecraft来教授体积和面积的计算,并通过泰勒的歌词教授讲故事和押韵技巧。与今天的基于文本的辅导相比,这种体验将更加丰富——例如,结合图形和声音——并且更加个性化。
4
生产力
在这个领域,竞争已经非常激烈。微软正在将其Copilot功能集成到Word、Excel、Outlook等服务中。谷歌也在通过助理、Bard及其生产力工具做着类似的事情。这些智能助手能完成许多任务,比如将文字文档转换成幻灯片,用自然语言回答电子表格相关问题,以及在体现每个人观点的同时 总结电子邮件讨论。
Agent的能力将更为强大。拥有一个Agent就像有一个专门协助你处理各种任务并在你需要时独立完成它们的人。例如,如果你有一个商业想法,Agent可以帮你撰写商业计划,制作演示文稿,甚至生成你产品可能的外观图像。公司可以为员工提供Agent服务,让Agent直接参与每次会议 ,回答问题。
“如果你的朋友刚做了手术,你的Agent将主动提出送花,并能为你完成订花服务。”
无论你是否在办公室工作,你的Agent都能像现今的个人助理一样为你提供帮助。如果你的朋友最近接受了手术,你的Agent会主动建议送花,并能帮你完成订购。如果你想和大学室友重聚,它会与对方的Agent协作安排见面时间,并在你抵达前提醒你,他们的大孩子刚刚开始在当地大学上学。
5
娱乐和购物
如今,人工智能已能帮助你挑选新电视,推荐电影、书籍、节目和播客。同样,我投资的一家公司最近推出了Pix,它允许你提出问题(例如,“我会喜欢哪些罗伯特·雷德福的电影?我在哪里可以看?”),然后根据你过去的喜好做出推荐。Spotify的AI驱动DJ不仅根据你的偏好播放歌曲,还会与你交流,甚至能称呼你的名字。
Agent不仅仅会提出推荐,它们还会帮助你实现这些推荐。如果你想买相机,你可以让Agent为你阅读所有评测,总结它们,给出建议,并在你做出决定后帮你下单。如果你告诉Agent你想看《星球大战》,它会知道你是否已订阅了相应的流媒体服务,如果没有,它会提出帮你注册。如果你不确定想看什么,它会提供定制化的建议,然后帮你播放所选的电影或节目。
你还可以获得根据你的兴趣定制的新闻和娱乐内容。CurioAI就是这一趋势的一个例子,它能根据你提出的任何主题创建定制播客。
6
技术行业的巨变
总之,Agent将能够帮助处理几乎所有活动和生活各个领域的事务。这对软件 业和整个社会都将产生深远的影响。
在计算行业中,我们讨论的是平台——应用程序和服务构建的基础技术。 Android、iOS和Windows都是平台的例子。 Agent将成为下一个平台。
“要创建一个新的应用程序或服务,你只需要告诉你的Agent你的需求。”
要创建一个新的应用或服务,你不需要掌握编程或图形设计技能。你只需告诉你的Agent你的需求。它将能够编写代码,设计应用的外观和感觉,创建一个logo,并将应用发布到在线商店 。OpenAI本周推出的GPTs展示了一个未来预览,即非开发人员也能轻松创建和分享他们自己的助手。
Agent将影响我们使用软件的方式以及软件的编写方式。它们将取代搜索网站,因为它们在为你查找和总结信息方面会更加高效。它们将取代许多电子商务网站,因为它们能为你找到最佳价格,并且不受限于少数几个供应商。它们将取代文字处理软件、电子表格以及其他生产力应用。今天是独立的业务——搜索广告、带广告的社交网络、购物、生产力软件——将合并成为一个业务。
我认为不会有任何单一公司主导Agent业务——将有许多不同的AI引擎可供选择。如今,Agent被嵌入到其他软件中,如文字处理软件和电子表格,但最终它们将独立运作。虽然一些Agent将免费使用(并通过广告支持),但我认为你将需要为大多数Agent付费,这意味着公司将有动力让Agent代表你的利益,而不是广告商的。今年开始研究AI的公司数量表明,将会有异常激烈的竞争,这将使Agent的价格非常亲民。
但在我所描述的高级Agent成为现实之前,我们需要面对关于技术及其使用方式的诸多问题。我之前已经写过AI引发的问题,所以在这里我将专门聚焦于Agent。
7
技术挑战
目前还没有人弄清楚Agent的数据结构应该是怎样的。为了创建个人Agent,我们需要一种新型数据库,它能够精确捕捉你的兴趣和关系的细微差别,并在保护隐私的同时快速提取这些信息。我们已经开始看到一些新的信息存储方式,比如向量数据库,这可能更适合存储由机器学习模型生成的数据。
还有一个未解之谜是,人们将与多少个Agent互动。你的个人Agent是否会与你的心理治疗Agent和数学辅导Agent分开?如果是这样,那么在什么情况下你希望它们相互合作,而什么时候应该保持各自的独立?
“如果你的Agent需要与你联系,它会通过耳机对你说话,或在你的手机上显示信息。”
你将如何与你的Agent互动?目前公司正在探索包括应用程序、眼镜、吊坠、别针,甚至全息图在内的各种选项。这些都是可能的方式,但我认为人类与Agent互动的首个重大突破将是耳机。如果你的Agent需要与你联系,它会通过耳机对你说话,或在你的手机上显示信息。(“你的航班延误了。你想等待,还是需要我帮你重新预订?”)如果你愿意,它还可以监控进入你耳朵的声音,并通过消除背景噪音、增强难以听清的语音或使带有重口音的人说话更容易理解来提升听觉体验。
还有其他的挑战。目前还没有一个标准的协议允许Agent之间相互通信。Agent的成本需要降低,使其对每个人都负担得起。激活Agent以获得正确答案的过程需要更加简单。我们需要防止在诸如健康这样的领域中出现幻觉,因为在这些领域中准确性至关重要,同时确保Agent不会因为偏见而伤害人们。我们不希望Agent做出它们不应该做的事情。(尽管我对恶意Agent的担忧少于对人类犯罪分子利用Agent进行恶意活动的担忧。)
8
隐私和其他重大议题
随着这些技术的融合,线上隐私和安全问题将比现在更加迫切。你会希望能够决定Agent可以访问哪些信息,以确信你的数据只被你选择的人和公司所共享。
但你与Agent分享的数据归谁所有,如何确保它被适当使用呢?没有人希望因为他们告诉心理治疗Agent的事情而开始收到相关广告。执法部门可以使用你的Agent作为对你不利的证据吗?你的Agent什么时候会拒绝做可能对你或他人有害的事情?谁来确定Agent内嵌的价值观?
还有一个问题是Agent应该分享多少信息。假设你想见一个朋友:如果你的Agent与他们的Agent交流,你不希望它说,“哦,她周二要见其他朋友,并不打算让你参加。”如果你的Agent帮你写工作邮件。
它需要知道不应使用你的个人信息或前任工作的专有数据。
这些问题中的许多已经是科技行业和立法者的关注重点。我最近参加了由参议 员查克·舒默组织的一场AI论坛,其他技术领导者也参加了这次论坛,许多美国参议员出席。我们分享了关于这些和其他问题的想法,并讨论了立法者采取强有力立法的必要性。
但其他问题不会由公司和政府决定。例如,Agent可能会改变我们与朋友和家人的互动方式。今天,你可以通过记住他们生活中的细节——比如他们的生日——来表明你关心他们。但当他们知道很可能是你的 Agent提醒你这件事并负责送花时,这会对他们来说还有意义吗?
在遥远的未来,Agent甚至可能迫使人类面对关于目的的深刻问题。想象一下,Agent变得如此优秀,以至于每个人都可以在几乎不用工作的情况下享有高质量的生活。在这样的未来,人们将如何利用他们的时间?当Agent拥有所有答案时,还会有人想要接受教育吗?在大多数人有大量空闲时间的情况下,能否维持一个安全繁荣的社会?
但我们离这一点还很远。
与此同时,Agent正悄然到来。
在未来几年里,它们将彻底改变我们的生活方式,无论是在线上还是线下。
如何学习AI大模型?
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;
第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;
第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;
第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;
第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;
第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;
第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。
👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;
• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;
• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。
1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集
👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓