大模型时代下，数字员工演进全景图：RPA/IPA/Agent

从蒸汽机到电力，再到计算机，每一次技术的飞跃都极大地提升了企业效率。

如今，随着数字化转型的浪潮席卷全球，企业开始寻求新的解决方案来优化业务流程、打破数据屏障，达到提效降本的目的。在这一背景下，数字员工的概念逐渐在企业界内“流行”起来。

根据RPA市场调研报告显示，2022年中国约有85%的企业与机构愿意与彼此互相了解的厂商进行合作，已经有43.8%的企业及机构开始了RPA的部分范围应用，17.9%的企业及机构在进行RPA规模化探索。其中，银行、保险、证券、电商与零售、政务等领域是RPA商用实践主力军。

从调研数据来看，RPA在企业中的认知度和接受度都相当高，大多数企业有计划将RPA应用于自身业务。此外，国家也持续出台相关政策加快包括RPA在内的新一代信息技术在各领域的应用，提高各行业管理效率，促进行业发展。

数字员工之所以能够快速获得企业的认可，一方面离不开企业对于高效营销解决方案的切实需求，另一方面则是数字员工的自动化解决方案，能够有效帮助企业解决重复低效工作和降低人力成本，平均应用ROI可达1：6。

在企业效率大幅提升的背后，与数字员工的多次技术迭代密不可分。数字员工的三个发展阶段分别为：RPA、IPA和Agent，分别代表了自动化技术的不同发展水平。RPA作为起点，通过模拟人类用户执行重复性任务来实现流程自动化；IPA则集成AI技术，提升了自动化的智能化水平，使得数字员工能够处理更复杂的任务；Agent智能体阶段，数字员工不仅能够执行任务，还能进行自主决策，与人类交互，为企业带来更深层次的变革。

接下来，实在智能将详细分析这三个阶段的技术特点、应用场景以及它们对企业运营的影响，旨在为企业提供一幅数字员工演进的全景图，帮助其更好地理解这一领域的最新发展。

RPA发展三阶段

一、RPA阶段 - 自动化的起点

RPA技术的起源和早期发展可以追溯到20世纪中叶的自动化生产线和工业机器人，而其作为现代软件自动化技术的成熟和广泛应用则是在21世纪初，特别是2010年以后。

RPA定义与原理

RPA（Robotic Process Automation,）是一种业务流程自动化技术，它通过软件机器人来模拟人类用户执行一些重复性高、基于规则的后台任务。这些任务通常包括数据的提取、录入、处理，以及文件的移动等。

用户通过RPA设计器的可视化设计界面，以“拖拉拽”方式构建自动化流程。在开发过程中，用户需要定义机器人的触发条件、任务序列、异常处理和数据流转。

这时候RPA的核心在于"模拟"能力，能够模拟鼠标点击、键盘输入、数据复制和粘贴等人类操作。通过这种方式，RPA软件机器人能够无缝地与现有的IT基础设施和应用程序集成，无需对现有系统进行大规模改造。

应用场景

企业应用RPA需要确定哪些业务流程适合自动化。这通常涉及对现有流程的详细审查，以识别那些重复性高、规则明确且耗时的任务；再通过专业实施团队进行技术评估，流程设计以及部署测试；稳定后，可能需要对机器人进行维护和更新，以确保它们继续高效地运行。

RPA技术的应用场景几乎涵盖了所有需要重复性数据输入和处理的业务流程，以下是一些典型场景：

财务和会计：自动执行发票处理、账目核对和财务报告生成等任务。
人力资源：自动化员工入职流程、薪资计算和福利管理。
客户服务：通过聊天机器人提供7×24h的客户支持，自动处理常见查询。
供应链管理：监控库存水平，自动下单补货，优化物流流程。
IT运维：自动化系统监控、故障排查和常规维护任务。

局限性

RPA的实施可以显著提高企业的运营效率，减少人为错误，并释放员工从事更高价值的工作。但也存在一些局限性：

系统脆弱：RPA机器人只能按照预设的规则执行任务，界面微小变化后需要重新配置
存在技术门槛：虽然RPA工具可视化界面对用户友好，但某些复杂的自动化任务实施仍需要专业实施
非结构化数据处理：RPA主要用于处理结构化数据，对图片、文档等非结构化数据的处理存在局限

二、IPA阶段 - 智能化的融合

尽管初代的RPA存在局限性，但仍然是企业实现初步自动化的重要工具。而通过结合AI技术，RPA的局限性可以得到缓解，例如利用机器学习、自然语言处理等技术处理非结构化数据，使RPA更加灵活和强大；通过结合智能屏幕语义理解技术降低使用门槛，使非技术人员也能构建自动化流程。

IPA的定义与原理

IPA（Intelligent Process Automation）是一种集成了多种智能技术，用于增强自动化流程的灵活性、适应性和智能化水平的自动化技术。它不仅能够执行基于规则的重复性任务，还能处理更复杂的业务场景，如决策支持、预测分析和认知自动化。

IPA的核心在于“智能”二字。与RPA相比，IPA设计器的人机交互更加智能化。在开发过程中，除了专业的“拖拉拽”方式，用户还可以选择基于AI技术的“点选用”方式构建自动化流程，想要实现哪个动作的自动化，只需要把鼠标悬停在界面元素上，对应的流程组件就会自动推送到眼前，用户按照实际动作选取即可。

IPA的“点选用”优势有多方面，其一是那些不精通技术的业务人员，可以自行使用IPA实现流程自动化，降低技术依赖；其二是当界面元素出现微小变化时，业务人员可以第一时间自行调整，降低运维成本，增强灵活性和敏捷性。

以上具备“点选用”特性的IPA是实在智能基于自研智能屏幕语义理解技术（ISSUT）和多年客户服务经验，于2022年全行业首发，这也为后面的Agent（RPA第三阶段演进）奠定了坚实基础。

技术集成

IPA是建立在RPA基础上为用户强大和灵活的自动化解决方案，依赖于多种AI技术的集成：

机器学习：ML算法能够从数据中学习并改进流程，使IPA能够适应新的数据模式和变化
智能屏幕语义理解技术：这是实在智能的自研技术，使得IPA能够理解屏幕上的元素和用户的操作意图，从而提供更准确的自动化建议
业务感知推荐：结合场景预测和自然语言处理技术，IPA能够推荐符合业务场景的自动化操作
页面结构分析技术：通过分析页面结构，IPA可以理解软件界面的布局，并适应页面变化，如拉伸、移动或内容位移

应用场景

这些AI技术的集成，使得IPA不仅仅能够执行简单的、规则明确的任务，还能够处理更复杂的、需要一定智能判断的任务，极大地扩展了自动化的应用范围和深度。以下是一些主要的IPA应用场景：

发票处理自动化：IPA可以自动处理来自不同供应商的发票，识别和提取相关信息，即使是非结构化内容和不同格式的发票也能应对
财务分析和报告：IPA能够快速分析大量财务数据，并生成准确、全面的财务报告，支持企业决策
审计判断：在审计工作中，IPA可以帮助审计人员快速准确地完成审计底稿的编制、数据比对等任务，并进行智能判断
工资核算：IPA可以自动化工资核算流程，检查员工数据的一致性，管理福利和付款，避免数据不准确和延迟

局限性

IPA在企业应用中具备比RPA更广泛的适应性和灵活性，但在实施过程中也面临着一些类似挑战：

技术复杂性：随着AI技术的集成，IPA系统的复杂性增加，需要专业人员进行维护和管理
数据隐私和安全：IPA处理大量敏感数据，需要加强数据保护和隐私措施
成本问题：引入IPA可能需要较高的初期投资，尤其是在采购高级分析工具和培训员工方面
变革抵抗：企业内部对变革的抵抗可能会阻碍IPA的实施和成功

三、Agent阶段 - 自主决策的实现

随着大模型技术的兴起，RPA也迎来第三次形态改变——Agent模式。大模型通常指的是使用大量数据训练而成的复杂机器学习模型，它们在自然语言处理（NLP）、图像识别、语音识别等领域展现出强大的性能。

2023年上半年，实在智能自研的垂直大模型TARS（塔斯）在国内大模型各类榜单名列前茅，具备“效果可用、成本可控、定制化训练、私有化部署”等差异化优势。

Agent的定义与原理

Agent可以看作是一种能够感知环境、进行决策和执行动作的智能实体，本质是一种结合大模型和自动化技术的AI助理，其自动化的能力主要来源于AI模型推理。同时，Agent具备自主性和自适应性，能在特定任务或领域中能够自主地进行学习和改进，甚至能够进行创造性的任务，如内容生成或复杂问题的解决。

在实在智能的AI产品矩阵中，实在Agent能够展现出接近人类专家级别的认知能力，可以很好地理解和解析人类语言，拆分为细小的自动化步骤，通过RPA实现全流程的自动化。简单地说，用户通过一句话描述任务，实在Agent就可以自动执行。

通过融入大模型技术，Agent能够提供更加强大和灵活的自动化解决方案，处理更加复杂和多样化的业务需求。这不仅推动了RPA技术的发展，也为数字化转型提供了新的动力。

技术集成

相较于IPA，Agent是在大模型技术的支持下，成为真正基于自然语言交互的数字员工或AI助理。以下是Agent模式RPA集成的一些关键技术：

自然语言处理NLP：NLP技术增强了RPA的文本处理能力，使其能够理解和处理人类语言，包括语音和文本
大语言模型LLM：LLM技术使得Agent模式的RPA能够进行更复杂的语言处理和生成任务
深度数据分析：Agent模式的RPA可以分析大量数据，预测未来趋势和行为，并据此做出决策

应用场景

通过融合AI技术，尤其是大语言模型（LLM），RPA在多个领域实现了广泛的应用。这种类型的Agent特别适用于人力资源管理、供应链优化、财务规划和风险分析。由于其不断增加的处理能力和知识，Agent能够提供及时准确的建议，以支持业务主管的决策过程。

客户服务：作为虚拟助手，Agent能够提供个性化的客户服务和支持
金融服务：在风险管理、投资咨询和个性化金融产品推荐中发挥作用
绩效管理：Agent可以跟踪员工的工作绩效，通过数据分析提供客观的绩效评估
辅助教育：Agent可以根据学生的学习历史和表现，推荐相关的学习资源、课程和活动

局限性

目前，Agent作为一种新兴技术，其发展前景广阔，但同时也面临着技术、市场和实施等方面的挑战。随着技术的不断成熟和市场教育的深入，预计这些局限性将逐步得到解决。

技术成熟度：虽然Agent技术发展迅速，但仍有许多项目处于概念验证和demo阶段
数据安全和隐私：随着越来越多的敏感数据通过Agent处理，如何确保数据安全和隐私仍是一个挑战
技术发展周期：AI和机器学习模型的发展需要时间，Agent在实现广泛的商业应用之前，可能需要经历一个相对较长的技术成熟周期

实在智能作为Agent领域的先行者，自成立之日起就专注于在AI算法上的持续投入，在解决数据安全方面做了很多创新和努力。比如，实在智能自主研发用于中文不当言论判别和生成终止的Detoxify系统，提升模型的安全性和无害性，让大模型“既懂事，又懂法”。此外，Agent支持私有化部署，在企业算力支持条件下，可以做到数据不上云，模型更可控、数据更安全！

四、RPA三阶段比较与未来趋势

为了更好地理解RPA、IPA和Agent三者之间的关系和差异，实在智能对它们进行了对比分析：

技术复杂性：

RPA：相对较低，主要依赖于固定规则和直接的脚本执行。
IPA：较高，需要集成多种AI技术以实现更高级的自动化。
Agent：最高，需要复杂的AI和机器学习算法来支持自主决策和学习。

自动化范围：

RPA：主要适用于标准化、重复性高的流程。
IPA：适用于需要一定程度智能判断和适应性的场景。
Agent：适用于需要高度自主性和复杂决策支持的领域。

对人类干预的依赖：

RPA：在大多数情况下需要预先定义的规则和定期的维护。
IPA：虽然减少了对人类干预的依赖，但在某些复杂决策时可能仍需人类介入。
Agent：设计为最小化人类干预，能够独立执行任务和做出决策。

成本与效益：

RPA：初期投资较低，易于实施，但可能需要持续的维护和更新。
IPA：初期投资和实施复杂性较高，但长期效益在于其智能化处理能力。
Agent：需要较大的初期投资和高度的技术专长，但能提供最大的自主性和灵活性。

整体而言，RPA、IPA和Agent三者并非相互独立，而是存在一定的演进和依赖关系。RPA作为基础，为自动化提供了一个起点，其技术相对成熟且易于实施；IPA作为扩展，在RPA的基础上，通过集成AI技术，提升了自动化的智能化水平；Agent作为目标，融合大模型技术，代表了自动化技术的未来方向。

尽管AI Agent在当下备受瞩目，但我们仍然需要认识到RPA技术的独特优势。比如，RPA的集成过程相对简单，这通常意味着在成本控制方面具有优势，对于智能化需求不高的自动化场景，RPA依然是首选。此外，在短时间内，AI Agent还无法用于操作成百上千的企业管理系统。

所以，Agent技术作为超自动化的一部分，实在智能会将其与其他AI、iPaaS等集成，形成更加全面的自动化解决方案。同样，这个过程也面临着一些可以预知的挑战，如技术复杂性、伦理和责任以及用户接受度等，这些挑战需要实在智能与企业和整个行业共同努力解决。