2022年开年以来,人工智能发展迅速,Transformers 的广泛应用使得语言、代码和图像生成等领域取得了巨大进展。在这个背景下,Adept 公司推出了第一个大型模型 Action Transformer (ACT-1),构建一个能在数字世界中采取行动的模型。
该模型经过训练后可以使用现有的所有软件工具、API 和 Web 应用程序,是实现通用智能的途径。下一个计算时代将由自然语言界面定义,而 ACT-1 恰好满足这一需求,可以通过自定义“渲染”观察浏览器窗口并进行操作,如单击、键入和滚动等。通过这些功能,ACT-1 可以给用户提供一个了解未来计算前沿的窗口。
来看几个官方给出的示例:
1、通过简单的文字输入,在指定的网站上找到合适的房源
2、在一个CRM系统中通过文字输入,自然将数据写入系统
3、通过自然语言输入,处理Excel表格
看完视频,是不是很像RPA技术,没有人工干预,程序按预定的路径执行任务,并可以多次交互,至到完成任务。
机器人流程自动化(RPA)系统是一种应用程序,它通过模仿最终用户在电脑的手动操作方式,提供了另一种方式来使最终用户手动操作流程自动化。
但ACT-1技术又与RPA是不同的,毕竟是在LLM的技术加持下,连程序员设定脚本这个过程都省略了,缺少了这个RPA恐怕无法执行任务。
由 ACT-1 等类似工具提供支持的自然语言界面将极大地扩展人们在计算机、手机、互联网连接设备前可以做的事情,不久的将来,我们有理由相信:
大多数与计算机、手机等媒介的交互将使用自然语言而不是通过用户界面来完成。
任何可以用语言表达自己想法的人都可以使用软件,无论相关专业知识掌握的程度如何。
我们不再需要学习每个软件的使用指南才能有效地完成任务。
AI 作为我们的得力助手,将加速各个业务领域的突破。
未来也许真的可以实现:Hey,Siri,帮我点一杯奶茶。手机自动唤醒相关App,在里面搜索一个最近的你常去的店面,根据你以往的口味,下单支付,你只需要坐着等着收外卖就好。
扩展阅读:
AI 学习心得速览(3月)
基于 AI大模型训练自己的小模型
代码不熟没关系,让AI替你写