Sam Altman再出手,投资了两个不到20岁的RPA创业者

news2024/11/27 11:54:08

在这里插入图片描述

“AI到底是变革还是泡沫?”

作者 | 王王
首图来源:IndiaTimes
Sam Altman又出手了。这次他投资了一个只有5个人的RPA早期团队Induced AI,两位联合创始人Aryan Sharma和Ayush Pathak,一个18岁,一个19岁。

不只是Sam Altman,SignalFire、Peak XV 、SV Angel等机构共同参与了Induced AI这一轮230万美金的种子轮融资。此次融资,科技加速器AI Grant的两位创始人Nat Friedman和Daniel Gross也加入了Induced AI的团队。这两位在科技界的大名如雷贯耳,Nat曾任Github的CEO,Daniel创立的搜索引擎公司Cue则被苹果收购。

这支团队及其产品有何过人之处,为何能够吸引众多大佬的橄榄枝呢?

01 RPA 3.0:打开浏览器,让AI完成所有工作

Induced AI的两位创始人——Aryan和Ayush——别看年龄小,创业经历却相当丰富。这两位年轻程序员的创业履历遍及医疗、广告、教育、区块链、web3等领域,甚至还发起过创业社群和类似孵化器的组织。

此次创立的Induced AI则是一款释放企业员工生产力的“RPA 3.0”。用户只需用简单的英语输入工作流程和录屏视频,Induced AI就能将其实时转换为伪代码,并调取多种相关工具,来执行大量重复性任务。

在这里插入图片描述

两位创始人|图源:Linkedln
RPA(Robotic Process Automation,机器人流程自动化)并非新鲜概念,普通人在日常生活中也随处可见,例如Excel中的“宏”,或者很多人用来抢演唱会门票的小工具“按键精灵”,都可以看做RPA的前身。传统的RPA定义上,软件记录人的操作,比如点击鼠标、键盘输入、打开文件夹、发送邮件等,并将这些操作固定下来形成规则和套路,批量地自动执行,从而节省人的时间,提升工作效率。随着AI技术进步,机器识别图像、理解语言、逻辑思考的能力不断提升,这些技术也与RPA结合到一起,释放更大的能量。

正如RPA概念所定义的,迄今为止,市面上的RPA工具需要人工制定好明确的规则,而复杂任务的规则也会耗费大量人力。Induced AI则借助大语言模型的能力,让工具有了逻辑推理和判断的能力。用户只需要说出他的需求,比如“给我建个Jira的ticket”,或者“帮我筛选一波简历,给候选人发面试邀请”,Induced AI就可以对要做哪些事情进行实时判断和拆解,并自动调取相关的工具来完成整个流程。

以筛选简历这个任务为例,常规的人工操作流程包括:登录你的领英账号、搜索简历、评估简历、下载简历、发送邀请等。如果领英没有提供官方的API接口,过去的RPA很可能就卡在登录这一步了,甚至可能被判定为恶意机器人。Induced AI在Chromium上构建了一个浏览器环境,它有自己的内存、文件系统和身份验证凭据(电子邮件、电话号码)来执行复杂的流程,因此可以自动完成登录、填写验证码、文件下载、存储和重复使用数据等动作,没有开放API的软件也拦不住Induced AI。

02 一波AI Agent正在袭来

让工具,特别是有智能的工具替人类干活,是从我们的老祖宗开始就产生的梦想。从木牛流马到Siri,人们始终觉得这些“助手”还欠点儿火候。直到ChatGPT和AutoGPT横空出世,AI Agent似乎即将成为可能。

OpenAI的研究员Lilian Weng撰文定义了基于大语言模型的AI Agent:大语言模型、记忆、任务规划、使用工具,四个模块缺一不可。尽管Induced AI团队将自己定位成“RPA 3.0”,但从其产品特性上来看,他们更像一个AI Agent,这也是为什么Sam Altman等AI大佬一致看好这个年轻的团队。

当前的AI热潮下,Induced AI不是第一个、也绝不是最后一个AI Agent团队。

暂且不提那些订票、点外卖的小而美Agent,或者AutoGPT、HuggingGPT等几乎人尽皆知的项目,与Induced AI有同样打造AI员工野心的团队就有不少。
例如今年三月完成3.5亿美元B轮融资的Adept,自己训练了一个ACT-1,这个模型专门用来在计算机上响应用户的自然语言指令并执行操作。它可以使用现有的所有软件工具、API和网站。ACT-1同样基于浏览器工作,用户可以在和AI的聊天框里输入自己的命令,例如在Salesforce里创建一条销售线索,或者在GoogleSheet里计算一些数据。

在这里插入图片描述

Adept的ACT-1|图源:Brigade Web

无独有偶,科技公司Rabbit也研发了自己的大模型LAM(Large Action Model),并基于它推出了一套完整的“个人操作系统Rabbit OS”解决方案。LAM能够观察人机交互的界面,形成“概念蓝图”,从而在用户的自然语言指令不那么明确的时候理解并实现人类的潜在意图。基于LAM,Rabbit还专门设计了一套软件平台,使其Agent能够更人性化地完成任务。今年10月,Rabbit获得Khosla Ventures领投、老股东跟投的2000万美元融资。

03 未来已来吗?

当然,除了创业团队,传统的RPA、低代码、无代码等公司,几乎无一不在拥抱大语言模型和AI Agent,毕竟在今天,只要一提这两个概念就能让投资人和客户眼前一亮,忍不住多看一眼。

今年以来,AI Agent的几个爆款应用和几次出圈,让人工智能的呼声一次次被推向高潮。可我们仍然不禁要问,未来已来吗?眼前的热闹是变革还是泡沫?

如果拿自动驾驶来做个比喻,我们更为熟悉的Copilot和Midjourney这样的产品类似L3级别的自动驾驶,即机器是人类的“助手”和“副驾”,而Agent对应着L4级别的自动驾驶,人类只需设定目标、监督结果,机器自己完成决策和执行。今天,L3级别的AI副驾仍然处于落地应用的早期,无论是技术能力还是商业价值,尚有大量值得探讨的问题,未能全面推广。

以此看来,L4级别的AI Agent大规模应用可能就更遥远了。那么,当前的AI热又是一波割韭菜的炒作吗?它是否会想几年前的区块链、VR、元宇宙一样,只是昙花一现?

在这里插入图片描述

Adept的ACT-1|图源:DEV
可以肯定的是,生成式AI以及相关的概念热度正在消退。

无论是媒体关注还是市场反应都已经暗暗证实了这一点。Gartner今年发布的技术成熟度曲线上,生成式AI和AI增强的软件工程都放在了膨胀期,意味着这两项技术在未来2-5年都即将进入幻灭期低谷——一如曾经的自动驾驶和上述技术概念。不过,正是在热度衰减、噪声安静的幻灭期,才有更多有意义的经验和知识沉淀下来,为接下来的启蒙期奠定基础。

在变革性技术的发展历程中,每一次波峰波谷都有意义。

从图灵机到IBM的超级计算机深蓝,从机器学习到神经网络,从AlphaGo到ChatGPT,每一个里程碑之间都充满失望、怀疑和寒冬,将视线拉长,人类走到今天已经取得了长足的进步。无论是否有泡沫,未来永远是乐观者和实干者创造的。

参考资料:
Sam Altman backs teens’ AI startup automating browser-native workflows(TechCrunch)
https://www.rabbit.tech/

https://www.adept.ai/

  • END -

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1177383.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

服务号能升级成订阅号吗

服务号和订阅号有什么区别?服务号转为订阅号有哪些作用?一、文章推送的篇数不同服务号在文章的推送篇数上是有所限制的(每月推4次)订阅号则每天可推送一篇文章。二、定义不同服务号主要是为关注用户提供服务使用的;订阅…

Azure 机器学习 - 使用Python SDK训练模型

目录 一、环境准备二、工作区限制三、什么是计算目标?四、本地计算机五、远程虚拟机六、Apache Spark 池七、Azure HDInsight八、Azure Batch九、Azure Databricks十、Azure Data Lake Analytics十一、Azure 容器实例十二、Kubernetes 了解如何用 SDK v1 将 Azure 计…

嵌入式系统设计与应用---ARM指令集(学习笔记)

目录 本文图片截取自书本和老师的ppt 概述 指令格式 指令的条件码 ARM的寻址方式 立即寻址 寄存器寻址 寄存器间接寻址 寄存器移位寻址 变址寻址 多寄存器寻址 相对寻址 堆栈寻址 块复制寻址 ARM指令集简介 跳转指令 1.B指令 2.BL指令 数据处理指令 1.数据传…

PostgreSQL简介及安装步骤

PostgreSQL简介 PostgreSQL是一款开源的关系型数据库管理系统,具有强大的扩展性、高度的可定制性和可靠的稳定性,因此在企业级应用和开发领域中得到了广泛的应用。本文将介绍PostgreSQL的基本概念以及在各种操作系统上的安装步骤。 安装步骤 1. Window…

94 腐烂的橘子

腐烂的橘子 题解1 多源广度优先搜索另一种写法 在给定的 m x n 网格 grid 中,每个单元格可以有以下三个值之一: 值 0 代表空单元格;值 1 代表新鲜橘子;值 2 代表腐烂的橘子。每分钟,腐烂的橘子 周围 4 个方向上相邻 …

儿童围栏上架亚马逊TEMU平台美国站做什么认证?儿童围栏认证标准ASTM F1004

ASTM F1004-21对 "伸缩门 "的定义是:"用于竖立在门口等开口处的障碍物,以防止幼儿通过,但可由能够操作锁定装置的老年人拆除"(第3.1.7节)。 ASTM F1004-21对 "可扩展围栏 "的定义是&am…

top和jstack分析堆栈问题

1.top 在服务器上,我们可以通过top命令查看各个进程的cpu使用情况,它默认是按cpu使用率由高到低排序的 由上图中,我们可以找出pid为21340的java进程,它占用了最高的cpu资源 2. top -Hp pid 通过top -Hp 21340可以查看该进程下&…

51单片机的篮球计分器液晶LCD1602显示( proteus仿真+程序+原理图+PCB+设计报告+讲解视频)

51单片机的篮球计分器液晶LCD1602显示 📑1.主要功能:📑讲解视频:📑2.仿真📑3. 程序代码📑4. 原理图📑5. PCB图📑6. 设计报告📑7. 设计资料内容清单&&…

通信原理板块——时域均衡

微信公众号上线,搜索公众号小灰灰的FPGA,关注可获取相关源码,定期更新有关FPGA的项目以及开源项目源码,包括但不限于各类检测芯片驱动、低速接口驱动、高速接口驱动、数据信号处理、图像处理以及AXI总线等 1、均衡器 为了减小码间串扰的影响…

十种排序算法(2) - 代码和原理

本文建立在上一篇文章的基础上:《十种排序算法(1) - 准备工具》 注:本文以升序为例子进行实现和解释 1.选择排序 选择排序是最简单几种排序算法之一 (1) 原理 不断使用查找并选择最小的元素放到数组的首端 (2) 复杂度分析 最好:O(n^2…

Flask(Jinja2) 服务端模板注入漏洞(SSTI)

Flask(Jinja2) 服务端模板注入漏洞(SSTI) 参考 https://www.freebuf.com/articles/web/260504.html 验证漏洞存在 ?name{{7*7}} 回显49说明漏洞存在 vulhub给出的payload: {% for c in [].__class__.__base__.__subclasses__() %} {% if c.__name__…

多测师肖sir_高级金牌讲师_jenkins搭建

jenkins操作手册 一、jenkins介绍 1、持续集成(CI) Continuous integration 持续集成 团队开发成员每天都有集成他们的工作,通过每个成员每天至少集成一次,也就意味着一天有可 能多次集成。在工作中我们引入持续集成,通…

ESP-IDF-V5.1.1使用websocket

IDF Component Registry (espressif.com) 在windows系统中,在项目目录下使用命令 idf.py add-dependency "espressif/esp_websocket_client^1.1.0"

OneNote Win10自带的宝藏笔记工具

大家在上学期间,通常要做大量的笔记,为后期巩固和复习。中学小学期间,大家往往是通过手写笔记来记录所学知识,然而上了大学,更加自由的学习条件下,大家逐渐开始用电子产品来做笔记。无论是平板还是电脑&…

【解刊】1区TOP,国人友好,仅1个月左右录用,2天见刊!

计算机类 • 好刊解读 今天小编带来Elsevier旗下计算机领域好刊的解读,如有相关领域作者有意向投稿,可作为重点关注!后文有同领域快刊发表案例,供您投稿参考~ 01 期刊简介 Knowledge-Based Systems ☑️出版社:Els…

Visual Studio 2022 + OpenCV 4.5.2 安装与配置教程

目录 OpenCV的下载与配置Visual Studio 2022的配置新建工程新建文件新建项目属性表环境配置测试先写一个输出将OpenCV的动态链接库添加到项目的 x64 | Debug下测试配置效果 Other OpenCV的下载与配置 参考这个OpenCV的下载与环境变量的配置: Windows10CLionOpenCV4…

「掌握创意,释放想象」——Photoshop 2023,你的无限可能!

Adobe Photoshop 2023(PS2023) 来了,全世界数以百万计的设计师、摄影师和艺术家使用 Photoshop 将不可能变为可能。从海报到包装,从基本的横幅到漂亮的网站,从令人难忘的徽标到引人注目的图标,Photoshop 2023让创意世界不断前进。借助直观的工…

Amazon EC2 安全可调用的云虚拟主机服务器

💗wei_shuo的个人主页 💫wei_shuo的学习社区 🌐Hello World ! Amazon EC2 打造全新的科技链 Amazon Elastic Compute Cloud(Amazon EC2)提供最广泛、最深入的计算平台,拥有超过 500 个实例&…

开放式耳机能保护听力吗?开放式耳机有哪些优缺点?

先说答案,开放式耳机是可以保护听力的! 想要了解开放式耳机是否能保护听力,就要先知道什么是开放式耳机,开放式耳机是一种无需入耳,并且使用时不会堵塞耳道,也不会隔绝外界声音的蓝牙耳机。 一、开放式耳…

Gitlab服务器配置LDAP指导

ssh登录gitlab服务器:192.168.1.203修改配置文件 sudo su vim /etc/gitlab/gitlab.rb找到ldap_enabled和ldap_servers关键字并修改参数 保存配置文件并重新载入配置 gitlab-ctl reconfigure检查ldap相关配置是否成功(列出前100个用户,若没…