AI 产品的五种交互模式

news2024/9/20 16:55:12

我们不是在创造人工智能,我们是在创造智能的控制者 —— James Barrat

历史

回顾计算机交互的演变历程,经历了批处理—命令行式交互—图形界面交互,AI 的出现带来了自然语言交互,基于人类的意图完成输出。

早期的批处理系统古朴且笨拙,交互依靠的是穿孔卡片——一种编码数据和指令的媒介。用户将一系列任务预先编码到这些卡片上,然后将它们交给数据中心。这里的计算机巨大如房间,它们不断地读取这些卡片,执行上面的命令。

需要排队等待一夜才能知道程序是否完成运行。即便如此,也能帮助科学家和工程师们执行复杂的计算任务,如天气预报的模拟、工程问题的数值分析,甚至是太空探索任务的轨道计算。

现在,在需要处理大规模数据集,如日志分析、金融交易记录或大量的用户行为数据时,批处理仍然是一个有效的方法。

图片

后来,分时系统的出现,让 CPU 可分配使用,提高了利用率,计算机可以根据命令对用户的每一个输入给出反馈。这种基于命令的交互,让用户可以控制计算机来执行任务,逐步解决问题。

但仍需要学习大量的指令,体验并不友好,不过至少让人感觉在和机器建立连接。

至今, Linux、Mac、windows 系统中的命令行仍然存在,是程序员们与计算机底层交互的常见方式。

图片

GUI 的出现彻底改变了规则,计算机不再只是枯燥的命令行,而是充满了窗口、图标和鼠标点击的界面。这种所见即所得的革新,让 word 、Excel 这样的效率工具出现,完全革命了人们的办公方式,浏览器出现,则成为了互联网的开端。

等智能手机普及后,GUI不再局限于笨重的桌面电脑。现在,一个小小的触屏设备就能完成从购物到预定机票,从社交到远程工作的各种任务。

当AI驱动的界面开始融入我们的生活,我们又站在了另一个交互革命的前沿,AI该如何改变软件,又怎样影响人们的生活。

基于意图的交互

现在只要你有问题,AI就能给你答案。

想要一幅太空宇航员的画作?不必亲自动手,AI可以根据你的描述生成几个选项供你选择。让我们的交流更直接,更本质,不再是命令和代码,而是愿望和创意的直接表达。

当移动互联网出现时,有人说所有的应用都值得用 APP 再做一遍,事实也确实如此。

那么所有的产品都值得用 AI 做一遍吗?如果是的话,该怎么做呢?

先来看看大模型厂商的答案:

OpenAI 作为生成式 AI 的破局者,提供面向C端的 ChatGPT 对话助手,和面向开发者的模型 API 调用,前者通过每月20美元的订阅模式,占到了总营收 34 亿美元的 80%。[1]

移动互联网时代有 APP,浏览器有插件,微信有小程序,它们都是依托于一个平台生态衍生出全新的软件交互和商业模式。

一个平台级的产品,必然拥有有良好的生态,用户因为找到合适的应用而付费、开发者因为有用户使用而入局、平台因为有持续增长而不断改善,机构、企业、组织陆续加入,广告、娱乐、购物统统改变。

OpenAI 也看到了这条路,并且也在这么做。

OpenAI 在去年先后推出了 GPT 插件,和GPTs,通过封装知识库和 Prompt 可以定制对话机器人,这样就能把 AI 的能力应用在垂直领域的。

解决更多用户问题,奥特曼也说通过佣金分成方式吸引开发者,从而建立起平台的生态。

在推出之际,就被行业内认为可以颠覆 PC、移动端操作系统。

现在一年过去,国内的大模型厂商也在推出类似GPTs 的功能——被大家称作 Agent 智能体。豆包、文心一言和 GPT 一样,允许用户创作Agent 并发布到广场。Kimi 就比较保守了,只是官方推出不允许用户创作。

不管怎么做,Agent 是有它的应用场景在的,不用每次都去输 Prompt 了,用户进入平台也能快速找到适用于自己的 Agent,但是它难以撼动操作系统,也难以成为平台级产品。

不论是用户创建的 Agent 还是官方推出 Agent,活跃度和创建数都在下降,用户用不起来,开发者也不愿意进来,平台在严格选择 Agent 的展示。

我们大可以想象未来 OpenAI 能够打造一个平台级产品,完全颠覆软件的交互和商业模式。

但目前来看,有苗头却看不到前景,因为传统应用的生命力太旺盛,而且他们也在融入 AI 的能力。

这些应用运行在windows、MacOS 、安卓和IOS,网页以及浏览器插件等。要么是传统应用+AI,要么是依托于AI而生的应用。

下面我就通过例子,来说明下 AI 在应用中的五种交互:

  1. 辅助回答型:集成在应用中的AI,能够根据用户的直接输入提供即时帮助和信息,如回答问题或提供具体操作的指导。
  2. 主任务驱动型:AI直接融入应用的核心功能,通过用户的常规操作触发,帮助优化和执行主要的业务或工作任务。
  3. 自动生成型:AI根据由其他任务触发而接收给定的输入自动生成内容,如给文章自动总结、打标签。
  4. 隐藏型:AI隐秘地工作,用户通常意识不到其存在,自动执行背后的优化和功能增强,如推荐系统或内容过滤。
  5. 工作流自动化:AI被集成到低代码工作流中,自动化处理输入和输出

图片

辅助回答型

在主应用界面,通过右侧面板或者弹窗内置一个对话框 ,在想用的时候就唤起,这种简单有效的方式是大部分应用采用的做法。

比如,现在使用微软Office或Google Docs处理文档时,遇到了表达或语法的困难。这时候,AI辅助回答框就是一个随时待命的助手,你可以随时向它提问或请求帮助。它能即时为你提供写作建议,还能帮你纠正错误。

好处在于你几乎感觉不到它的存在。缺点就是每次都要复制内容,思考问题才能完成输入,这和在网页端使用GPT有什么区别的,看似融入AI,如果模型能力不够垂直或强大,这样的融合意义不大。

图片

主任务驱动型

我一直认为Notion的做法非常的巧妙,23年初就已经融入AI, 成为了文档类产品的交互设计的典范,当你在创作的过程中,在Notion的page里编辑你的bolok ,给AI 输入的内容可以是你现在所写的东西,AI输出的答案也会呈现也在当前的page中。

它很好的处理了AI打断任务的影响,我会为这样的便利而付费,即使模型的输出能力比不上GPT4。

图片

它的优势就是体验更加流畅,但它也会增加系统的复杂性,如果集成一个生成质量或性能的模型,这样做无疑带来很大风险。

自动生成型

通过我们在使用软件过程中的任务,自动触发AI的能力,不同于主任务驱动型,自动生成不需要用户输入问题或指令,它能够根据用户当前的任务触发AI的使用,自动生成内容。

比如:Arc浏览器中,当用户创建新的浏览器标签时,AI自动分析页面内容并生成相关描述性强的标签名称,帮助用户更容易识别和管理开启的多个标签页。

再比如:Notion的database中,用户可以定义一个表头字段为AI生成类型,如标签(AI ),那么在创建一条记录时,这个标签会根据主内容自动生成。

这种结合方式,我想象不到什么缺点,很多场景都有待使用这种方式改善,比如文件夹、笔记的命名管理。

图片

隐藏式

AI 的能力早已隐藏在我们使用的数码产品中,以至于我们感受不到它的存在,在使用手机拍照的时候,手机识别不同的景色、光线来优化照片的拍摄效果,在相册搜索关键词,比如猫,就能搜到所有和猫相关的照片;Siri 会根据你的日常查询和命令优化其响应。这些背后都是算法的能力。

当然,今天提到的GenAI也有很多隐藏式的,iOS最新的Apple Inteligence,CEO 蒂姆库克强调苹果的AI助手在设计上对于用户来说更加“自然”,不张扬但又无处不在。例如在文本辅助生成环节,Apple Intelligence建议回复的内容文本直接呈现在输入法内部;在归纳总结文档时,交互按键也很好的被设计并且集成在界面的侧边位置。

图片

\5. 工作流自动化

如果你手头上有成堆的进度报告和计划调整需求。通常这种情况下,你可能需要花费大量时间在手动分析和整理数据上,但有了AI,你就可以把数据发给它做总结分析。

不过这样,还不够理想,假如你想指定某一行去分析,并且将分析结果写入表格,GPT就不可能实现了,必须要借助工具去搭建一个工作流,这样你不仅可以在任务中自动使用AI的能力,还能批量去处理相同的任务。

这本质上是低代码工具+AI,大模型厂商都在售卖自家的模型API,通过API接入到低代码工作流中。

低代码比如苹果的快捷指令,Dify、n8n、zaiper、集简云等等,通过拖放界面设计工作流,集成大模型的API后,AI在背后帮助自动化数据处理和决策逻辑。

图片

这种交互方式不同于Agent,它具备更高的灵活性,和更强的能力,感兴趣的可以动手实践。

今天了解这些多少能帮你在使用 AI 产品时有个方法论,目前的交互再怎么花哨也逃不出这几种。最后再来给这五种交互方式做一个简单的总结:

图片

移动互联网发展依托于手机这一硬件,经历了工具产品,娱乐社交产品,购物生活产品,最后到 ToB 产品的演变,AI 和那个时代已经不同,没有成熟的硬件,技术栈也不同。

但相同的的是,都是在早期出现大量的工具产品,因为工具产品场景足够明确。

未来,娱乐类,社交类,购物类如何发展,我们拭目以待。


我是空格,一个想要把 AI 用的更好的 AI 产品经理,目标是每天用 AI 节省 4 小时工作。

如何学习大模型

现在社会上大模型越来越普及了,已经有很多人都想往这里面扎,但是却找不到适合的方法去学习。

作为一名资深码农,初入大模型时也吃了很多亏,踩了无数坑。现在我想把我的经验和知识分享给你们,帮助你们学习AI大模型,能够解决你们学习中的困难。

我已将重要的AI大模型资料包括市面上AI大模型各大白皮书、AGI大模型系统学习路线、AI大模型视频教程、实战学习,等录播视频免费分享出来,需要的小伙伴可以扫取。

一、AGI大模型系统学习路线

很多人学习大模型的时候没有方向,东学一点西学一点,像只无头苍蝇乱撞,我下面分享的这个学习路线希望能够帮助到你们学习AI大模型。

在这里插入图片描述

二、AI大模型视频教程

在这里插入图片描述

三、AI大模型各大学习书籍

在这里插入图片描述

四、AI大模型各大场景实战案例

在这里插入图片描述

五、结束语

学习AI大模型是当前科技发展的趋势,它不仅能够为我们提供更多的机会和挑战,还能够让我们更好地理解和应用人工智能技术。通过学习AI大模型,我们可以深入了解深度学习、神经网络等核心概念,并将其应用于自然语言处理、计算机视觉、语音识别等领域。同时,掌握AI大模型还能够为我们的职业发展增添竞争力,成为未来技术领域的领导者。

再者,学习AI大模型也能为我们自己创造更多的价值,提供更多的岗位以及副业创收,让自己的生活更上一层楼。

因此,学习AI大模型是一项有前景且值得投入的时间和精力的重要选择。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2069477.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

uefi模式无法读取u盘启动怎么办_uefi模式无法读取u盘启动解决方法

最近有网友问我uefi模式下我按快捷方式或bios中都认别不了U盘,无法正常选择u盘启动进入pe安装系统,出现这种情况一般是bios中设置了uefi模式,而制作的u盘启动不支持uefi启动导致,那么uefi模式无法读取U盘启动怎么办?下…

摄影曝光:曝光模式认知

写在前面 理解不足小伙伴帮忙指正 😃,生活加油 99%的焦虑都来自于虚度时间和没有好好做事,所以唯一的解决办法就是行动起来,认真做完事情,战胜焦虑,战胜那些心里空荡荡的时刻,而不是选择逃避。不要站在原地…

万亿低空经济赛道,如何抢占先机?

在万亿低空经济赛道中抢占先机,需要企业在多个方面进行全面布局和战略规划。以下是一些关键策略: 一、明确低空经济的定义和潜力 低空经济作为战略性新兴产业和未来产业,已经上升为国家经济工作重点。它是指各类低空航空器在飞行活动中所关…

工商业光伏项目如何顺利运行

工商业光伏项目如何顺利运行 鹧鸪云 工商业光伏可以细分为两大类,一类是针对工业企业的光伏项目,另一类则是针对商业企业的光伏项目。工业企业光伏项目通常是指在工厂、工业园区等工业用地安装光伏系统,利用太阳能发电,以满足工…

Linux(云服)安装go

我的系统环境 一、获取安装包 接下来先在Windows物理机上获取安装包 set http_proxyhttp://127.0.0.1:7897 set https_proxyhttp://127.0.0.1:7897 wget https://go.dev/dl/go1.20.7.linux-amd64.tar.gz然后通过xshell的rz命令将go1.20.7.linux-amd64.tar.gz发送至我的云服&a…

【解压即玩】使命召唤 系列合集17-1,经典收藏

《使命召唤》(英语:Call of Duty)是一款以第二次世界大战为背景的第一人称射击游戏,该游戏使用了基于雷神之锤III引擎的升级版本,即重返德军总部游戏引擎的改良版。游戏的故事线从不同的角度展开,玩家将扮演…

使用ddns-go实现自动配置IPv6的DDNS

正文共:888 字 17 图,预估阅读时间:1 分钟 前面说到通过PPPoE拨号获取到的IPv6地址没有发生变化(企业路由器配置IPv6家用宽带的PPPoE拨号示例),结果说完就打脸了。中间家里停了一次电,路由器重新…

大规模泛癌筛选揭示抗癌药物组合的新希望

大规模泛癌筛选揭示抗癌药物组合的新希望 引言 在抗癌治疗中,药物组合因其潜在的增效作用而备受关注。然而,由于可能的组合数量巨大且肿瘤间存在显著的异质性,识别真正有效的药物组合成为一项极具挑战性的任务。近期,一项发表在《…

Open WebUI快速应用ollama模型,实现通过web交互模型,实战llama3

文章目录 前言安装docker安装Open WebUIdocker指令安装docker-compose.yaml安装 访问网站无法选择模型问题处理修改ollama服务配置 重新正常访问页面 前言 基于大模型的应用,通过linux快速实现部署,相应教程可通过传送门快速了解: linux-ubu…

驱动开发系列13 - Linux Graphics 图形驱动概述(二)

目录 一:概述 二:Linux图形驱动演进 3.1 X11基础结构 3.2 DRI/DRM基础结构 四:帧缓冲区驱动程序 4.1 创建帧缓冲器驱动程序 4.2 帧缓冲区操作 五:直接渲染管理器(DRM) 5.1 内核模块(DRM) 5.2 DRM 批量缓冲区提交模型 5.2.1 硬件共享 5.2.2 内存管理和安全 5.3 模式…

搜狐新闻HarmonyOS Push开发实践

本文字数:1795字 预计阅读时间:15分钟 01 背景 搜狐新闻作为HarmonyOS的合作伙伴,于2023年12月成功上架鸿蒙单框架应用市场,成为首批鸿蒙应用矩阵的一员。 推送作为新闻类应用的重要组成部分,我们将其纳入到二期功能开…

【手撕OJ题】——141/142. 环形链表

目录 🕒 题目 Ⅰ⌛ 方法① - 快慢指针🕒 面试题🕒 题目 Ⅱ⌛ 方法① - 快慢指针⌛ 方法② - 转换为链表相交问题 🕒 题目 Ⅰ 🔎 141. 环形链表【难度:简单🟢】 给你一个链表的头节点 head &am…

【Electron】桌面应用开发electron-builder打包报错问题处理

Electron 桌面应用开发electron-builder打包过程中各种报错问题处理 前一篇有写过 Electron 桌面应用开发快速入门到打包Windows应用程序 在安装到打包的整个过程中,我们都会遇到很多诡异的问题,接下来我将介绍我遇到的几个问题的解决方案 一、拉包的时…

普元EOS-微前端实现路由

1 前言 EOS微前端已经对路由进行了封装,内置了 $router 对象,直接使用就实现了路由。 2 实现代码 this.$router.push({ path: /a/b }) 由于这些就是普通的路由对象的封装,就不过多描述使用方法。 有兴趣的同学可自行百度了解 vue router对…

CAAC执照:无人机飞手培训就业组装技术很重要

一、CAAC执照概述 CAAC(中国民用航空局)颁发的无人机执照,全称为《民用无人机操控员执照》,是无人机行业中最权威和含金量最高的证书。考取该执照后,无人机飞手可以合法地申请空域、航线,并从事无人机相关…

【动态规划】简单多状态 dp 问题

简单多状态 dp 问题 1.面试题 17.16. 按摩师2.打家劫舍 II3.删除并获得点数4.粉刷房子4.买卖股票的最佳时机含冷冻期5.买卖股票的最佳时机含手续费6.买卖股票的最佳时机 III7.买卖股票的最佳时机 IV 点赞👍👍收藏🌟🌟关注&#x1…

前端技术(四)—— 最经典Node.JS全套教程

一、node简介 1. 浏览器中的 JavaScript 的组成部分 2. 思考:为什么 JavaScript 可以在浏览器中被执行 3.思考:为什么 JavaScript 可以操作 DOM 和 BOM 4. 浏览器中的 JavaScript 运行环境 5. 思考:JavaScript 能否做后端开发 6. Node.js介绍…

MySQL 的半同步模式

目录 1 半同步简介: 解决主从数据一致性问题 2 实现半同步模式实践操作 2.1 MASTER 2.2 SLAVE 1 2.3 SLAVE 2 2.4 查看client链接状态 2.5 SLAVE 服务器故障模拟 2.5.1 停止 SLAVE 的 IO_THREAD 2.5.2 查看SLAVE 的IO线程是否关闭 2.5.3 查看 MASTER 上 client 的连接状态…

专业视频编辑和制作软件Adobe Media Encoder(ME)win/mac下载安装和软件介绍

一、软件概述 1.1 软件简介 Adobe Media Encoder(ME)是由Adobe公司开发的一款专业视频编辑和制作软件,全称为Media Encoder,是Creative Cloud套件中的一个重要组件。Adobe ME以其强大的视频编码、转码、调整、剪辑、合成等功能&…

解决git checkout -b 拉取远端某分支到本地时报错

问题描述 日常开发场景中,经常会出现切分支的情况,所以git checkout 命令是非常高频的 git checkout -b feature/xxx默认情况下,这条命令是基于当前所在分支来开辟新分支feature/xxx 但是,还有一些情况,我们需要基于…